﻿cel mai mic număr întreg pozitiv k astfel încât xk mod n = ; vezi Secțiunea ) Din această condiție rezultă că numerele x modn, , xn i modn sunt distincte și coprime de r și, prin urmare, acestea trebuie să fie numerele , , , r - , aranjate într-o anumită ordine Astfel, r nu are divizor propriu Dacă r este un număr prim, atunci un astfel de număr x (numit rădăcină primitivă a lui r) există întotdeauna (vezi exercițiul - ) De fapt, există destul de multe astfel de rădăcini primitive Există b Dacă produsul (b f~f+ max(/~, /+)) este mai mare decât n, atunci cantitatea mică de calcul suplimentar descrisă în această lucrare este suficientă pentru a răspunde la întrebarea dacă n este prim Prin urmare, proprietatea numerelor de până la de cifre poate fi verificată într-o fracțiune de secundă prin extragerea din n ± a tuturor factorilor primi h modn ) Dacă j = și y = , sau dacă y = n - , atunci algoritmul se termină și este afișat mesajul "n este probabil simplu" Dacă j > și y = , treceți la pasul P P [Măriți } ] Creșteți j cu Dacă j !, ,pm} În ex arată limita inferioară pentru P, din care putem concluziona că cel mai lung timp de execuție al algoritmului este de ordin ^/N m log# domnul/r\ unde r = log v^ oyot ( ) Dacă setăm lnm aproximativ egal cu |\/lnLnp ln ZV, atunci presupunând că Pm = O(mlogm), obținem r și y/In N/ In In N - , ca urmare a căreia formula ( ) simplifică și ia forma exp( >/(ІnChV)(Іn p V) + O((log AQ^QoglogjVp^Ooglog jV))) Prin urmare, în ipoteze adecvate, timpul de execuție așteptat al algoritmului E nu trebuie să depășească valoarea ZV ^, unde e(ZV) sa ^/ln nAg/ nA: tinde spre ca N -> oo Când N se află în intervalul cel mai frecvent utilizat în practică, trebuie să aveți grijă să nu luați în serios o astfel de estimare asimptotică De exemplu, dacă N = IO , obținem ZV / = (lgZV)Q pentru a și , , dar aceeași relație este valabilă pentru a ≈ , când N = IO Funcția Ar(A') are un ordin de creștere care este un fel de intersecție a lui Ni/a și (lgZV)Q, dar toate cele trei egalități sunt practic aceleași pentru numerele N care nu sunt inacceptabil de mari Numeroase experimente de calcul efectuate de M C Wunderlich au arătat că o versiune bine reglată a algoritmului E realizează o descompunere mult mai bună decât această estimare [vezi Note de curs la matematică ( ), - ]; în ciuda faptului că pentru N = IO există ^/ln InZV/lnZV n , la factorizarea a mii de numere în intervalul IO =i unde f este definit în ex , deoarece, în esență, aceasta este valoarea așteptată a valorii lui ln(v v r) la trecerea la pasul E Dacă numărul de balene este bine ales, efectuarea descompunerii E dă rezultate și mai bune Alegerea unui număr m adecvat se poate face experimental, deoarece analiza de mai sus a comportamentului asimptotic este incompletă și nu se poate fi sigur de acuratețea informațiilor obținute Prin urmare, introducerea a numeroase perfecționări în algoritmul asociat cu o astfel de alegere a lui m poate duce la consecințe imprevizibile De exemplu, comparând execuția pasului E cu execuția algoritmului A, se poate obține următoarea îmbunătățire importantă Esența sa este că procesul de descompunere în factori primi poate fi oprit după găsirea T mod pj / și [T/pj] pj și m mod T / ; (b) dacă T este încă > p m după ce toți factorii au fost selectați mare, pentru grupuri de, să zicem, aproximativ de valori V consecutive; procesul de factorizare poate fi continuat ulterior, dar numai pentru valorile lui V din fiecare grupă pentru care se obține cel mai mic reziduu curent T (Înainte de a extrage factori mai mari decât p , este util să se calculeze V mod Pi P? P p{ p{ ), unde toți f sunt suficient de mici încât modulele P^P^P^P^P ^ poate fi reprezentat la , dar sunt suficient de mari pentru a satisface egalitățile V modp{' + = Prin urmare, un rest cu precizie caracterizează valoarea lui V modulo cinci numere prime mici ) Pentru o estimare a lungimii ciclului a rezultatului algoritmului E, vezi H C Williams, Math Comp ( ), - "■ Limită superioară teoretică Din punct de vedere al complexității computaționale a algoritmului, este de dorit să se știe dacă există o metodă de factorizare al cărei timp de execuție așteptat poate fi mărginit de estimarea (N'W), unde e( X) -> ca N -> oo S-a arătat mai sus că comportamentul algoritmului E probabil satisface această estimare, dar ar fi de dorit să se găsească o dovadă riguroasă a acestui fapt, deoarece fracțiile continuate nu sunt bine ordonate Prima dovadă că există un astfel de algoritm de factorizare a fost găsită în de John Dixon El a arătat că, de fapt, este suficient să luăm în considerare o versiune simplificată a algoritmului E, din care aparatul fracțiilor continue este eliminat, dar ideea principală a relațiilor ( ) rămâne Metoda lui Dixon [Math Comp ( ), - ] este după cum urmează Să presupunem că există cel puțin doi factori primi diferiți pentru N și că N nu este divizibil cu primele m prime p^, p , , pm Alegem un număr întreg aleatoriu X din intervalul mr/(r!X) în cazul în care r = [log λ/( log pm )J, deci timpul de execuție al algoritmului poate fi estimat aproape în același mod ca în ( ), dar în acest caz valoarea ѵОV trebuie înlocuită cu valoarea N De data aceasta alegem r = y/ \nN/ În N + Ѳ, unde | | m Prin urmare, numărul așteptat de valori de ieșire MP(m,N) va fi de cel puțin m Timpul de execuție al algoritmului este de ordinul MmlogN plus O(m ') pași, care rezultă din rezultatele ex ; prin urmare, aflăm că O(m ) se dovedește a fi mai mic decât Mm logN, care este egal cu exp(y/ (ln AG)(ln n AG) + O((log N) / (log log N)- / (log log log AG))) Probabilitatea ca folosind această metodă să nu se poată obține un multiplicator este neglijabilă, deoarece probabilitatea ca valorile de ieșire mai mici de m să fie calculate (Ex ) nu depășește e m / , în timp ce probabilitatea ca din numărul primelor valori de ieșire de m, nu se va găsi niciun factor, nu depășește ~m și m IpL' Se demonstrează următoarea teoremă Dickson oarecum consolidată Teorema D Există un algoritm al cărui timp de execuție este O(NrlN''), unde e(N) = Cy/lnlnN/lnN și c este o constantă arbitrară mai mare decât y/ , și care găsește un factor netrivial de N cu probabilitate este O(l/N) dacă N are cel puțin doi divizori primi | Alte abordări John M Pollard a propus un alt mod de factoring [Proc Cambridge Phil soc ( ), - ], care oferă o modalitate practică de a găsi factorii primi p ai lui N pentru cazul în care numărul p - nu are factori primi mari Acest algoritm (vezi exercițiul ) a fost probabil prima încercare de a rezolva problema în cauză, după ce a devenit clar că algoritmii A și B pentru numere mari N au durat prea mult pentru a se finaliza R K Guy, în colaborare cu J H Conway, și publicat în Congressus Numerantium ( ), - , a trecut în revistă starea problemei la acea vreme și perspectivele dezvoltării de noi metode de rezolvare a acesteia Guy a declarat: "Aș fi surprins dacă cineva în acest secol ar putea factoriza numere de lungime IO fără a prevedea cazuri"; chiar a trebuit să fie surprins de multe ori în următorii de ani Progrese semnificative în dezvoltarea metodelor de factorizare prime s-au făcut în anii , începând cu metoda de cernere pătratică a lui Cari Pomerance, dezvoltată de acesta în [cf Note de curs în Comp sci ( ), - ] Apoi Hendrik Lenstra a dezvoltat metoda curbei eliptice [Annais of Math ( ), - ] El a sugerat euristic că pentru a găsi un factor prim p, este necesar să se efectueze aproximativ exp(-^/( + e) ( n p) ( n n p)) operații de înmulțire Această valoare nu este altceva decât rădăcina pătrată asimptotică a estimării timpului de rulare pentru E când p > n/ v și devine și mai bună dacă N are factori primi relativ mici O descriere excelentă a acestei metode este dată de Joseph H Silverman și John Tate în Rațional Points on Elliptic Curves (New York: Springer, ), capitolul În , John Pollard a revenit la rezolvarea acestei probleme El a propus o nouă abordare, care mai târziu a devenit cunoscută sub numele de sita de câmp numeric O serie de lucrări despre această metodă, care este în prezent campioana pentru factorizarea numerelor extrem de mari, pot fi găsite în Note de curs la matematică ( ) Când se utilizează această metodă, ordinul estimat al timpului de execuție este exp (( / + s) / ( p IV) / (In In N) / ) ( ) la N oo Conform analizei efectuate de A K Lenstra, pragul după care metoda sită de câmp numeric bine reglat începe să depășească metoda de cernere pătratică bine reglată este numărul N ≈ IO Detaliile acestor metode depășesc scopul acestei cărți, dar vă puteți face o idee despre eficacitatea lor acordând atenție unora dintre cazurile deja cunoscute de încercări nereușite de factorizare a numerelor Fermat de forma + De exemplu , factorizarea + = - ■ p s-a obţinut folosind metoda sită a câmpului numeric după calcule timp de patru luni, care au luat tot timpul liber al lucrărilor Manssseasse, aproape [ ] Comp ( ), - ; ( ), ]; unde p denotă un prim de de biți Următorul număr Fermat a fost de două ori mai lung decât cel anterior, dar folosind metoda curbei eliptice din octombrie , rezultatul a fost obținut: + = ■ • • p [Richard Brent, Math Comp ( ), - ] De fapt, Brent a folosit deja metoda curbei eliptice în pentru a rezolva următoarea problemă: + = - - ■ • p - Toți factorii primi, cu excepția unuia, s-au dovedit, deși cu ceva noroc, a fi mai mici de - ~ După aceea, alegem un alt număr aleator plauzibil p între, să zicem, IO și IO Găsim primul prim p de forma kri + , unde k > p , k este par și k = pi (modulo ) Pentru a face acest lucru, înainte de a găsi numărul prim p, va fi necesar să verificați prіp " de numere Un prim p va avea aproximativ de cifre lungime; o construcție similară poate fi folosită și pentru a căuta un număr prim q cu o lungime de aproximativ de cifre Pentru a asigura super-fiabilitatea, este de dorit să ne asigurăm că p+ și Dacă Un = (modulo pe), atunci Unp = (modulo pe+ ) ( ) Acest rezultat rezultă din considerațiile mai generale prezentate în Ex - , dar relațiile ( ) pot fi și ele demonstrate direct pre- să presupunem că Un = bpe, Un+i = a Conform ecuațiilor ( ) și ( ), avem IDp = bpe( a - bpe) = aUn (modulo pe + ), iar Dgp-rі = C + - U = a În mod similar, 'zp = Pzp-schPp PzpPp- = a t n și Pzp-|-i - Ușn-ț-iUn+i U nfJn = o În general Ukn = kak~ Un și Ukn+i = ak (modulo pe+ ) Prin urmare, luând k = p, obținem ( ) Din formulele ( ) și ( ), extinzând ( ± \/ )n conform teoremei binomiale, putem obține expresiile rămase pentru Un și Vn: Punând acum n = p, unde p este un număr prim impar și folosind faptul că (t) este un multiplu al lui p, cu excepția cazului în care k = sau k = p, concluzionăm că Sus = z(p )/ ; VR = (modulo p) ( ) Pentru p / , după teorema lui Fermat avem p = ; prin urmare ( ^p ^ - ) x ( (p-i)/ + ) = o și s(p-x)/ = ± Dacă ip = - , atunci Up+l = UP - Up i = UP + Vp - Up+i = -Up+i-, deci Up+i modp = Dacă Up = + , atunci Up i = UP - Up+ i = UP - Vp - Up-i = -Up-i-, deci Lp i modp = Astfel, se demonstrează că pentru fiecare prim p există un întreg (p) astfel încât r p+e(p) modp = , |e(p)| + iPj) = (|) Гп În plus, deoarece Pj + ej este un număr par, atunci t / - \/b)/ )n+ = ~nY(n + }>/ n+ ~ k>/s k = ( n)/ y(n + ^ * M k / & / k K Deoarece n este un număr prim impar, coeficientul binomial /n + \ /n\ / n \ \ k ) ~ \ k) + \ k - / este divizibil cu n, cu excepția cazului în care k = și k = n + Prin urmare, (ni)/ y q i = j + (n+ )/ (modulo n) Aici = ( ('+ )/ ) , deci conform teoremei lui Fermat r^-i)/ = ( ("+ )/ )(n- ) = i Ca urmare, datorită unui caz simplu al legii reciprocității resturilor pătratice (Ex ), N Arată cum să transformi procedura descrisă într-un algoritm potrivit pentru implementare directă într-un computer, fără a utiliza operații de înmulțire [M ] Fie n un număr întreg impar și n > Să se arate că dacă numărul A(n) din teorema B este un divizor al lui n - dar nu este egal cu n - , atunci n trebuie să fie de forma рір • • - Ptî unde toate pі sunt prime distincte și t > ► [M ] (John Selfridge) Demonstrați că dacă pentru orice divizor prim p al lui n - există xp astfel încât acel număr [M ] Ce va rezulta algoritmul E dacă = , k = , m = ? [Indicaţie y/ ■ = + // , , // ] ► [M S] Dezvoltați un algoritm care, folosind rezultatul algoritmului E, găsește un factor prim potrivit N care permite algoritmului E să genereze suficiente date pentru a obține o soluție pentru ecuația ( ) [HM ] (JD Dixon) Demonstrați că odată ce algoritmul din Ex este reprezentat de soluția (x, bo, • , em), ai cărei exponenți depind liniar modulo de exponenții din soluțiile anterioare, când numărul N are diferiți factori primi și se alege valoarea lui x aleatoriu, probabilitatea ca factorii primi de descompunere să nu fie găsiți este egală cu d [M ] Demonstrați că la efectuarea pasului E al algoritmului E, numărul T nu este niciodată multiplu al unui factor prim impar p, pentru care inegalitatea (fcJV/,, ^ modp > ► [M J] (Lucas și Lehmer) Fie P și Q numere întregi între prime și Uo = , Ui = , Un+i = Pt/n-Qt/ ni pentru n > Demonstrați că dacă N este un număr întreg pozitiv coprim cu P - Q, iar dacă Un+i mod N = , p împărțind N + , atunci N este un număr prim (Ca urmare, obținem o metodă de verificare dacă numerele sunt numere prime în cazul în care sunt cunoscuți divizorii numărului N + , și nu divizorii numărului N - Valoarea lui Um poate fi calculată în trepte O(logm), ca în Exerciţiul - ) [Indicaţie Vezi demonstrația teoremei L ] [M ] Mulțimea primelor Mersenne este infinită? [M ] (V R Pratt ) O demonstrație completă că numerele sunt prime folosind teorema inversă a lui Fermat ia forma unui arbore cu noduri (q, x), unde q și x sunt numere întregi pozitive care îndeplinesc următoarele condiții, (i) Dacă nodurile (dі,хі), , (qt,Xt) sunt generate de nodul (q,x), atunci q = qi qt + [În special, dacă (q, x) este copilul cel mai mic, atunci q = ] (ii) Dacă nodul (r, y) este generat de nodul ( oo? ► [MZO] (M O Rabin (M O Rabin) ) Fie, pentru un număr dat n, pn probabilitatea ca algoritmul P să dea un rezultat eronat Arată că pn și pentru toate numerele întregi impare q > , conform următoarei reguli: ( ) = p(?-i)/ (prin Modulo q) când q este un număr prim, (t) = (^-) (^-), când numărul q este egal cu produsul dintre qi qt și t numere prime ( nu neapărat distincte) Astfel, simbolul Jacobi este o generalizare a simbolului Legendre (vezi exercițiul - ) a) Demonstrați că (E) satisface următoarele dependențe, care permit calculul eficient: (|) = ; (|) = ; (£) = (p m°d *); (|) = (- )(, )/ ; (^) = (,)(£-); (^) = (- )(p (' >/ (|), dacă ambele numere p și q sunt impare [Ultima regularitate, care este o relație inversă și reduce calculul (t) la calculul ( Ex - (d) pentru p și q fiind numere prime, deci în acest caz special, acest model poate fi considerat valid ] b) (Solovay și Strassen ) Demonstrați că dacă n este un număr impar, dar nu prim, atunci numărul de numere întregi x astfel încât și impar, iar x > este un număr întreg, spunem că numărul n "trece algoritmul P prin x" dacă fie x mod n = , fie executarea paşilor P -P duce la concluzia că numărul n este probabil prim Demonstrați că pentru orice N există o mulțime de numere întregi impare pozitive xi, , xm și , cu excepția cazului în care este un pătrat perfect, are o fracție continuă periodică de forma y/D = R + //ai, ,а", R,ai, , an, R, ai, , an, R, //, unde R = u ("i, • • • , On) este un palindrom (adică succesiunea simetrică a; = Пп+і-і pentru -> -> În general, putem spune că q este succesorul lui p , dacă p și q sunt ambele numere prime și q = fcp+l pentru unele k > De exemplu, -> -> -> -> -> -"■ -> -> -"• -> -> -> ( de biți săriți) ->•••; cel mai mic succesor al numărului conține cifre Găsiți cel mai lung lanț succesor posibil de numere prime ► [M ] (A Shamir (A Shamir) ) Să considerăm un automat abstract care poate efectua operațiile x + y, x - y, xy [x / y] pe numere întregi x și y de lungime arbitrară; lungimea unor astfel de numere nu contează Automatul le stochează în memoria cu acces aleatoriu și poate alege diferiți pași de program pentru efectuarea operațiilor, în funcție de dacă egalitatea x = y va fi satisfăcută pentru numerele date x și y Scopul acestui exercițiu este de a arăta că într-un astfel de automat se poate aplica o modalitate uimitor de rapidă de factorizare a numerelor în factori primi (Deci va fi probabil destul de greu să arăți că factorizarea prime este extrem de dificilă pe computerele reale, deși bănuim că este ) a) Pentru un întreg dat n > , găsiți o modalitate de a calcula n pe un astfel de automat ipotetic! în cicluri O(logn) [Indicaţie Dacă A este un număr întreg suficient de mare, atunci coeficienții binomi ((tm)) = m\/(m - A)! A! poate fi calculat cu ușurință din valoarea numărului (A + ) m ] b) Arată cum, pe un astfel de automat, se calculează numărul /(n) în cicluri O(log n) pentru o valoare întreagă dată n > cu următoarele proprietăți: /(n) = n dacă n este prim, în caz contrar /( n) este divizorul propriu (nu neapărat prim) al lui n [Indicație Dacă n , atunci una dintre astfel de funcții /(n) este gcd(m(n),n), unde m(n) = min{m | T! mod n = } ] (Ca o consecință a lui (b), o descompunere în factori primi completă a unui număr arbitrar de mare n poate fi găsită prin efectuarea numai de operații aritmetice O(logn) Pentru o factorizare parțială dată n = m ■ nT, fiecare dintre numere n, care nu sunt prime, pot fi înlocuite cu funcțiile /(n;) • (n;//(n | + e, unde y este un element aleatoriu al lui Qm Scopul acestui exercițiu este de a demonstra că problema rezolvată cu G este aproape la fel de dificilă ca problema factorizării numărului m a) Elaborați un algoritm A(G,m,e,y, ) care utilizează numere aleatoare și un algoritm G pentru a prezice, fără a fi nevoie să calculați y/y, dacă un întreg dat y va aparține lui Qm Rezultatul executării algoritmului trebuie să fie corect cu probabilitate > - , iar timpul T(A) de execuție a acestuia nu trebuie să depășească O(e (logS~ )T(G)) în ipoteza că T(G) > r (Dacă T(G) ) + Xv = I și A(i>i + • • ■ + i>n) = (Ash + ■ • • + Ai>n + | (ti>i + • ■ • + Ti>m)/mJ) mod Mai departe avem m(|i>) = |(ri> +mai>); aici cantitatea |i> înlocuiește (^tjmodm Dacă ±i> ∈ Qm, avem m(±v) = Vv y, deci algoritmul G oferă o modalitate de a prezice valoarea lui Ai> pentru aproximativ jumătate din totalul v [M ] (J Hâstad) Arătaţi că nu este greu de găsit x în cazul în care (a; o, ac, a, , a, z, m;) = şi mn i > IO la n) astfel încât lungimea (i>t) [Indicație Începeți prin a forma un set de numere u, astfel încât numărul api modp să aibă doar factori primi mici ] [M ] Un citat dintr-o sursă literară x = XiXr, prezentat în coduri ASCII, în formă criptată arată ca (x? mod N, xi mod V) = ( E EF C D S B CDBAB AO C AA C A FA OFA EF AC CEO D D C D E A A E FE ODC ADF B BOCBD A CEO A B E B BD B A AD B D A B, B E AEE A CF F B E E DD AEF F S E BC C B A E AF FE FF FD E O A DBB BB C A DA O S FE C D B CB FA DOC C A E DB OE AC ) în notație hexazecimală, unde N este B B ECA FEF O O OC O D S FFE D F E F C DS FC AA F O CED BCA O BEA FFDC F A ED B F CCAB OO B B F EBD F F BEE E DFD AD D Ce este x? Problema recunoașterii numerelor prime din numerele compuse și a factorizării numerelor compuse în factori primi este una dintre cele mai importante și utile dintre toate problemele aritmetice Vocația înaltă a științei pare a fi aceea că orice contribuție la soluționarea unei probleme atât de elegante și celebre ar trebui cultivată cu sârguință - Ph D GAUSS (C F GAUSS), Disquisitiones Arithmeticae, articolul ( ) ARITMETICA POLINOMIALA Tehnologiile pe care le-am studiat sunt aplicabile în mod natural nu numai numerelor, ci și diferitelor mărimi matematice Această secțiune se va concentra pe polinoame, care este un pas înainte de numere Din punct de vedere formal, un polinom peste S este o expresie a formei u(x) \u d uxn + F ux + u , ( ) unde coeficienții un, , w, uq sunt elemente ale unui sistem algebric S, iar variabila x poate fi privită ca un simbol formal fără un sens definit Vom presupune că sistemul algebric S este un inel comutativ cu identitate Aceasta înseamnă că S admite operații de adunare, scădere și înmulțire care satisfac proprietățile obișnuite: adunarea și înmulțirea sunt operații binare asociative și comutative definite pe S, iar înmulțirea este distributivă în raport cu adunarea Există, de asemenea, un element de identitate în plus și un element de identitate în înmulțirea , astfel încât a + = aia- = a pentru tot a din S Scăderea este operația inversă a adunării, dar posibilitatea împărțirii ca invers de în ceea ce privește înmulțirea, nu se presupune nimic Polinomul Оа:п+тЧ hOa:n+ + una:nH і-шт + о este considerat identic cu polinomul ( ), deși formal diferă de acesta Spunem că ( ) este un polinom de grad n cu coeficient de conducere un dacă un ; in acest caz scriem deg(u) - n, ((u) = un ( ) În plus, prin definiție deg(O) = -oo, £( ) = , ( ) unde înseamnă polinom zero, adică un polinom ai cărui coeficienți sunt toți egali cu zero De asemenea, spunem că u(x) este un polinom normalizat dacă coeficientul său principal ε(u) este egal cu Aritmetica polinomială constă în primul rând din adunare, scădere și înmulțire; uneori se adaugă și altele la aceste operații, cum ar fi împărțirea, exponențiarea, factorizarea și găsirea celui mai mare divizor comun Adunarea, scăderea și înmulțirea sunt definite într-un mod natural, ca și cum variabila x ar fi un element al lui S: adunăm sau scădem polinoame prin adăugarea sau scăderea coeficienților la aceleași puteri ale lui x Înmulțirea se face conform regulii (jug: g H F U ) (vsXS H h Po) \u d Wr + sxr + s H h w , Unde Wk = ioѵk Ch- uiVk-i Ch-Ch-ikѵ ( ) În ultima formulă, u și vj sunt tratate ca egale cu zero pentru i > r și, respectiv, j > h * Aici simbolul I înseamnă conducere (conducere; în literatura de matematică în limba rusă - senior) - Notă, trad Un sistem algebric S este de obicei o mulțime de numere întregi sau de numere raționale Poate fi și un set de polinoame (cu alte variabile decât x); atunci ( ) este un polinom în mai multe variabile În special, sistemul algebric S poate consta din numere întregi , , , m - cu adunarea, scăderea și înmulțirea efectuate modulo m (vezi formula -( )); acest caz important se numește aritmetică polinomială modulo m Deosebit de importantă este aritmetica polinomială modulo când fiecare coeficient este fie , fie Cititorul ar trebui să noteze asemănarea dintre aritmetica polinomială și aritmetica de precizie multiplă (Secțiunea ), unde baza b este înlocuită cu x Principala diferență este că coeficientul ub al lui xk în aritmetica polinomială, în general, nu este conectat în niciun fel cu coeficienții vecini i fc±i, deci conceptul de "transfer" dintr-un loc în altul este absent în aritmetica polinomială De fapt, aritmetica polinomială modulo b este în esență identică cu aritmetica multiprecizie modulo b, cu excepția absenței purturilor De exemplu, să comparăm înmulțirea lui ( ) cu ( ) în sistemul numeric binar cu înmulțirea analogă a lui x + x + cu x + x + modulo Numere binare x Polinoame modulo x Produsul acestor polinoame modulo se obține prin eliminarea tuturor purtătorilor și este x + x + x + x + x + x + Dacă înmulțiți polinoamele în același mod ca și numerele întregi, fără a obține resturile modulo , rezultatul va fi să fie egal cu x + x + x + Zr + X + x + ; transferurile nu sunt folosite nici în acest caz, dar coeficienții din produs pot fi arbitrar mari Din cauza asemănărilor puternice dintre aritmetica polinomială și aritmetica cu precizie multiplă, nu este necesar să discutăm în detaliu adunarea, scăderea și înmulțirea în această secțiune Cu toate acestea, este necesar de remarcat unele aspecte care disting utilizarea practică a aritmeticii polinomiale de aritmetica de precizie multiplă Foarte des, atunci când se lucrează cu polinoame, există o tendință de apariție a unui număr mare de coeficienți zero și polinoame de grade uriașe și, prin urmare, este de dorit să se utilizeze forme speciale de reprezentare a polinoamelor (vezi Secțiunea ) În plus, aritmetica polinomială multivariabilă duce la programe care sunt cel mai ușor de înțeles din punct de vedere al recursiunii (această situație va fi discutată în Capitolul ) Deși metodele de adunare, scădere și înmulțire a polinoamelor sunt relativ simple și directe, câteva aspecte importante ale aritmeticii polinomiale merită o atenție specială Următoarele secțiuni vor discuta diviziunea polinomială și tehnicile conexe, cum ar fi găsirea celui mai mare divizor comun și factorizarea Vom lua în considerare și problema calculului eficient polinoame, adică problema găsirii valorii lui u(x) pentru un x ∈ S dat folosind numărul minim posibil de operații Cazul special al calculării xn pentru n mare este destul de important și este considerat separat în Secțiunea Primul set mare de rutine computerizate pentru lucrul cu aritmetica polinomială a fost sistemul ALPAK [WS Brown, J P Hyde și B A Tague, Beli System Tecii J ( ), - ; ( ), - , - ] O altă piatră de hotar timpurie în acest domeniu a fost sistemul PM de George Collins [CACM ( ), - ; vezi, de asemenea, C L Hamblin, Comp J ( ), - ] EXERCIȚII [ ] Când lucrați cu aritmetică polinomială modulo , care va fi diferența dintre x + și x + ? Care va fi produsul dintre m + x + și Ex + ? [ ] Sunt adevărate următoarele afirmații? (a) Produsul polinoamelor normalizate este normalizat (b) Produsul polinoamelor de tip grad are gradul m + n (c) Suma polinoamelor de tip grad are gradul max(;n,n) [M ] Dacă fiecare dintre coeficienții u, ■ ■ , id, ѵe, , Vd din ( ) este un număr întreg care îndeplinește condițiile |tc| deg(v) > deg(r - u ) , te obținem o contradicție (deoarece egalitatea (qi(x) - q (x))v(x) = Г (х) - гг(х) implică deg(( n > Algoritmul găsește polinoame q(x) = qm nxm~n -F -F q , r(x) = rn-jz"- -F F r peste câmpul S îndeplinind condiţiile ( ) Dl [Iterați peste A: ] Efectuați pasul D pentru k = m - n, m - n - , , ; apoi terminați execuția algoritmului cu (rn i, , r ) = (un i, , u ) D [Ciclul de împărțire ] Setați mai întâi qk un+klvn, apoi - Uj uj - qkVj-k pentru j - n + k - , n + k - , , k (Acțiunea ultimei operații este de a înlocui u(x) cu u(x) - qkxkv(x), un polinom de grad l ( ) Un element inversabil în acest caz este un element care are o valoare reciprocă, și anume un element u astfel încât uv = pentru unele v G S Un element simplu este un element p care nu este inversabil, astfel încât ecuația p = qr este adevărată numai dacă q sau r este un element inversabil Reprezentarea ( ) este unică în sensul că dacă pi ■ pt = Qi- ■ • Qs, unde toate p și q sunt simple, atunci s = t și există o permutare mrі setați astfel încât Pi = ai qni, , pt - atqirt pentru unele ai reversibile, , at Cu alte cuvinte, factorizarea în factori primi este unică până la ordinea factorilor și până la înmulțirea cu cei reversibili Orice câmp este un domeniu al unei factorizări unice în care fiecare element diferit de zero este inversabil și în care nu există elemente prime Numerele întregi formează o regiune de descompunere unică, în care elementele inversabile sunt F și - , iar elementele prime sunt ± , ± , ± , ± , ± etc Cazul când S conține toate numerele întregi este fundamental, deoarece este adesea preferabil să se lucreze cu coeficienți întregi decât cu coeficienți raționali arbitrari Unul dintre faptele cheie despre polinoame (vezi exercițiul ) este că polinoamele dintr-un domeniu de descompunere unică formează un domeniu de descompunere unică Un polinom care este simplu în acest domeniu este de obicei numit ireductibil Folosind în mod repetat teorema privind unicitatea descompunerii, se poate demonstra că polinoamele din mai multe variabile peste mulțimea de numere întregi sau peste orice câmp cu orice număr de variabile pot fi descompuse în polinoame ireductibile într-un mod unic De exemplu, un polinom în trei variabile r - r p + r r - r r peste numere întregi este produsul a cinci polinoame ireductibile • • x • ( r - p) • ( r + yz) Același polinom peste numere raționale este produsul a trei polinoame ireductibile ( r) • ( r - p) • ( r + yz) Această descompunere poate fi scrisă ca r • ( r - p) • (r + $yz) și într-un număr infinit de moduri, deși descompunerea este în esență unică Ca de obicei, spunem că u(r) este un multiplu al lui v(r), iar v(x) este un divizor al lui u(r) dacă u(r) = v(r)q(r) pentru un polinom q (r) Dacă există un algoritm care determină dacă și este un multiplu al lui v pentru elementele arbitrare nenule u și v ale unui domeniu al unei descompunere unică a lui S și permite determinarea lui w dacă u = v ■ w, atunci algoritmul D oferă o metodă pentru a afla dacă u(x) multiplu al lui v(r) pentru polinoamele arbitrare nenule u(x) și v(x) peste S Dacă u(r) este un multiplu al lui v(r), este ușor să vezi că un+k trebuie să fie un multiplu al lui vn când treci la pasul D ; de aici se va afla câtul u(x)/v(x) Aplicând recursiv această observație, obținem un algoritm care răspunde la întrebarea dacă un polinom dat peste S în orice număr de variabile este un multiplu al altui polinom peste S și, de asemenea, un algoritm care va găsi coeficientul dacă există unul Se spune că un set de elemente dintr-o regiune a unei descompunere unică este coprim dacă nu există niciun element prim al acestei regiuni a unei descompunere unică care să împartă toate celelalte elemente Polinom peste aria singurului Se spune că o descompunere este primitivă dacă coeficienții ei sunt coprimi (nu se confunda această noțiune cu noțiunea destul de diferită de polinoame primitive mod p discutată în Secțiunea ) Următorul fapt, prezentat pentru polinoame peste numere întregi de C F Gauss în secțiunea a celebrei sale cărți Disquisitiones Arithmeticae (Leipzig, ), este de o importanță capitală Lema G (Lema Gauss) Produsul polinoamelor primitive pe un domeniu al unei singure descompunere este primitiv Dovada Fie u(x) = uxm Fu și v(x) = vyxn Fvq polinoame primitive Fie p orice element simplu al domeniului; atunci trebuie arătat că p nu împarte toți coeficienții u(x)v(x) Prin presupunere, există un indice j astfel încât uj nu este divizibil cu p și un indice k astfel încât u* nu este divizibil cu p Fie j și k cei mai mici astfel de indici; atunci coeficientul lui x^+k în u(x)v(x) este egal cu ujVfc - uj+lVk-i F uj+kv - uj-iVk+i F uovk+j Deoarece primul termen al acestei sume nu este divizibil cu p, dar toți ceilalți sunt divizibili, întreaga sumă nu este divizibilă nici cu p | Dacă un polinom diferit de zero u(x) peste un domeniu al unei descompunere unică S nu este primitiv, se poate scrie u(x) = pi ■ u(x), unde pi este un element simplu din S care împarte toți coeficienții u (x), iar u(x) este un alt polinom diferit de zero peste S Toți coeficienții u(x) au un factor prim mai mic decât coeficienții corespunzători u(x) Acum, dacă u(x) nu este primitiv, putem scrie u(x) = p • u(x), etc Acest proces se va termina necondiționat când u(x) = c ■ uk(x), unde c GS și uk( x) este primitiv De fapt, există o lemă H corespunzătoare lemei G Lema H Orice polinom diferit de zero u(x) peste un domeniu al unei descompunere unică S poate fi factorizat sub forma u(x) = c • v(x), unde c este un element al lui S și v( x) este un polinom primitiv Mai mult, această reprezentare este unică în sensul că dacă u = u • u(x) = c ■ v (x), atunci ei = ac și v (x) = av(x), unde a este un element inversabil al lui S Dovada Am arătat deja că o astfel de descompunere există, astfel încât doar unicitatea descompunerii are nevoie de dovadă Să presupunem că u • u(x) = C ■ r (x), unde u(x) şi v (x) sunt polinoame primitive Fie p un prim în S Dacă pk împarte c , atunci împarte și c ; în caz contrar, pk trebuie să împartă toți coeficienții c • v (x), iar p trebuie să împartă toți coeficienții v (x) Astfel, obținem o contradicție cu premisa primitivității lui v (x) În mod similar, pk împarte c numai dacă pk împarte u În consecință, în virtutea unicității expansiunii, u = ac , unde a este inversabilă; deoarece = ac • u(x) - c • r> (x) = c • (asch(x) - r> (x)), se obține ac(x) - r> (x) = | Astfel, orice polinom diferit de zero u(x) poate fi scris ca u(x) = cont(u) • pp(u(x)), ( ) unde cont(u) este conținutul u, care este un element al lui S și pp(u(x)) este partea primitivă u(x), care este un polinom primitiv peste S În cazul în care u(x) = , este convenabil să se definească cont(u) = pp(u(a:)) = Combinația Lemelor G și H conduce la relațiile cont(u • v) = a cont(u) cont(v), pp(u(ar) -v(x)) = i>pp(u(ar)) pp(v(ar)), unde a și b sunt elemente inversabile în funcție de calea de evaluare a conținutului, cu ab = Când se lucrează cu polinoame pe numere întregi, doar + și - sunt elemente inversabile și, prin urmare, este convenabil să se definească pp(u(m) ) astfel încât coeficientul ei de senior a fost pozitiv; atunci ( ) este adevărată pentru a - b = Când avem de-a face cu polinoame dintr-un câmp, se poate lua cont(u) = £(u), astfel încât pp(u(:r)) este un polinom normalizat; în acest caz ( ) este din nou valabil pentru a - b - pentru toate u(x) și v(x) De exemplu, să presupunem că lucrăm cu polinoame pe numere întregi și să fie u(x) = - x + și v(x) = x + Atunci cont(u) = - , pp(u(a:)) = x - , cont(v) = + , pp(v(m:)) = x + , cont(u • v) = - , pp(u(a:) • v(x)) = x + a: - x - Cei mai mari divizori comuni În cazul unei singure descompunere, se poate vorbi de cel mai mare divizor comun a două elemente; este divizorul comun care este divizibil cu cel mai mare număr de elemente prime (vezi formula -( )) Cu toate acestea, deoarece domeniul unei descompunere unică poate avea multe elemente inversabile, există o oarecare ambiguitate în definiția celui mai mare divizor comun Dacă w este cel mai mare divizor comun al lui u și v, atunci a ■ w, unde a este un element inversabil, este și cel mai mare divizor comun În schimb, ipoteza unicității factorizării implică concluzia că, dacă atât u, cât și u > sunt cei mai mari divizori comuni ai lui u și v, atunci wi = a • W , unde a este un element inversabil Cu alte cuvinte, nu are sens să vorbim despre un anumit divizor comun (în original - "a vorbi despre cel mai mare divizor comun" - Notă, trad ) și și v Există un întreg set de cei mai mari divizori comuni, fiecare dintre care diferă de ceilalți printr-un factor inversabil Luați în considerare acum problema găsirii celui mai mare divizor comun a două polinoame date peste un sistem algebric S, pusă inițial de Pablo Nunez în Libro de Algebra (Anvers, ) Dacă S este un câmp, atunci problema este relativ simplă; algoritmul nostru de împărțire, algoritmul D, poate fi extins la un algoritm pentru calcularea celui mai mare divizor comun, în același mod în care algoritmul lui Euclid (Algoritmul A), care găsește cel mai mare divizor comun a două numere întregi, se obține din algoritmul de împărțire numere întregi: dacă v(x) = , atunci mcd(u(a:), r>(r)) = u(r); altfel mcd(u(a:),v( :)) = mcd(v(x),r( :)), unde r(r) este definit de ( ) Această procedură se numește algoritmul lui Euclid pentru polinoame peste un câmp A fost folosit pentru prima dată de Simon Stevin în L'Arithmetique (Leiden, ); vezi A Girard, Les (Euvres Mathematiques de Simon Stevin (Leiden, ), De exemplu, este necesar să găsim gcd x + x + Iot + lOz + ir + x + și Z: + a: + a: + a: + , mod , folosind algoritmul euclidian pentru polinoame peste câmpul numerelor întregi modulo În primul rând, notează doar coeficienții pentru a arăta pașii algoritmului D ) Deci x + x + a: + a: + a: + x + este ( a: + )( a: + a: + a: + a: + ) + ( a: + x + ) În mod similar Pentru: + a: + a: + a: + \u d ( a: + ) ( Іa: + Zx + ) + ( a: + ); a: + Za: + = ( a: + x + a: + )( a: + ) + ; ( ) a: + = ( a: + ) - + (Semnul egal aici înseamnă egalitate modulo , deoarece toate operațiile aritmetice asupra coeficienților sunt efectuate modulo ) Calculul arată că este cel mai mare divizor comun al celor două polinoame originale Deoarece orice element de câmp diferit de zero este un element inversabil al regiunii polinomiale peste câmp, se obișnuiește ca câmpurile să împartă rezultatul algoritmului la coeficientul său de conducere, obținând un polinom normalizat, iar asta înseamnă când se vorbește despre cel mai mare divizor comun (în original - "se numește cel mai mare divizor comun" dintre aceste două polinoame, mcd, calculat în ( ), se dovedește astfel a fi , nu Ultimul pas din ( ) poate fi omis , deoarece dacă deg( v) = , atunci mcd(n(a:),v(;r)) = indiferent de alegerea polinomului u(x) În ex , se determină timpul mediu de rulare al algoritmului euclidian pe polinoame aleatoare modulo p Să revenim la o situație mai generală în care polinoamele sunt date pe un domeniu de descompunere unică care nu este un câmp Din ( ) putem deriva relații importante cont(gcd(u, v)) = a ■ gcd(cont(u),cont(v)), pp(gcd(u(a:),v(a:))) = ft-gcd(pp(u (a:)),pp(v(a:))), unde a și b sunt elemente inversabile Aici mcd(u(x),v(x)) înseamnă orice polinom din x care este cel mai mare divizor comun al u(x) și v(x) Formulele ( ) reduc problema găsirii celui mai mare divizor comun al polinoamelor arbitrare la găsirea celui mai mare divizor comun al polinoamelor primitive Algoritmul D pentru împărțirea polinoamelor într-un câmp poate fi generalizat pentru pseudodiviziunea polinoamelor peste orice sistem algebric care este un inel comutativ cu unitate Se poate observa că algoritmul D necesită împărțirea explicită doar cu £(v), coeficientul principal este v(x), iar pasul D se realizează exact m-n + ori Astfel, dacă u(x) și v(x) încep cu coeficienți întregi iar dacă lucrăm pe câmpul numerelor raționale, atunci singurii divizori ai lui Zv)m~'r+ vor fi numitorii q(x) și r(x) Această observație duce la ideea că este întotdeauna posibil să se găsească polinoame q(x) și r(x) astfel încât £(v)m n+ u(a:) = q(x)v(x) + r(x), deg(r) n Algoritmul R (Pseudodiviziunea polinoamelor} Polinoame date u(x) = UmXm + • • ■ + ИіЯ + Po, ѵ(х) = VpХП + • • • + Vj-X + Vq, unde vn / și m > n > Acest algoritm găsește polinoamele q(x) = qm nxm~n-\ bto iar r(x) = rn-ixn~l + • • • + r care satisface ( ) R [Iterați peste A: ] Efectuați pasul R pentru k = m - n, m - n - , , ; după aceea, algoritmul se termină cu răspunsul R [Ciclul de înmulțire ] Setați mai întâi q^ un+kѵk și apoi - Uj deg(v) Folosind algoritmul R, definim un polinom r(x) care satisface ( ) Acum putem demonstra că mcd(i*(:r),v( :)) = mcd(v(a:),r( :)): orice divizor comun al u(x) și ѵ(x) divide ѵ (x) și r(x)- și invers, orice divizor comun v(x) și r(x) împarte £(v)m~n+ u(x) și trebuie să fie primitiv (deoarece v(x) este primitiv) , deci împarte u(x) Dacă r(x) = , avem gcd(u(a:),v( :)) = v(a:); pe de altă parte, dacă r(x) , deoarece v(x) este primitiv, avem gcd(v(a:),r(x)) = gcd(v(a:),pp(r(a:): )) ) astfel încât procesul să poată fi repetat Algoritmul E (algoritmul generalizat al lui Euclid) Având în vedere polinoame nenule u(x) și ѵ(x) pe un domeniu al unei descompunere unică S Algoritmul calculează cel mai mare divizor comun al u(x) și ѵ(x) Se presupune că există algoritmi auxiliari pentru calcularea celui mai mare divizor comun al elementelor lui S, precum și pentru împărțirea a la b în S cu b și a divizibil cu b El [Reducere la polinoame primitive ] Setați d gcd(cont(H), cont(v)) folosind un algoritm auxiliar pentru a calcula cel mai mare divizor comun din S (Prin definiție, cont(u) este cel mai mare divizor comun al coeficienților u(a: ) ) Înlocuiți u(a;) cu polinomul u(a:)/cont(u) = pp(u(a:)); în același mod, înlocuiți v(x) cu pp(v(a:)) E [Pseudodiviziune ] Calculați r(x) folosind algoritmul R (Nu este nevoie să calculați coeficientul polinomial q(x) ') Dacă m(x) = , treceți la pasul E Dacă deg(r) = , înlocuiți v(x) cu polinomul constant " " și treceți la pasul E EZ [Faceți restul primitiv ] Înlocuiți u(x) cu v(x) și înlocuiți v(x) cu pp(r(a:)) Reveniți la pasul E (Acesta este un "pas euclidian" similar cu ceilalți algoritmi euclidieni pe care i-am luat în considerare ) E [Adăugarea de conținut ] Algoritmul se termină cu răspunsul d ■ v(x) | Ca exemplu de funcționare a algoritmului E, calculăm polinoamele mcd u(x) \u d x + x - Zch - Zx + r + x - , ( ) v(x) = x + w - a: - x + peste numere întregi Aceste polinoame sunt primitive, deci d ' ( ) ѵ(x) , , , , - , - , o o -i ' ' și ' p '' ' Pentru a îmbunătăți acest algoritm, putem reduce u(x) și v(x) la polinoame normalizate la fiecare pas pentru a elimina factorii reversivi care complică prea mult coeficienții De fapt, obținem algoritmul E peste numere raționale: , , , , - , - , , , - , , |, ,-|, - , i,o,-i,o,| ' > ѵ(x) , ,|, ,- ,- , i,o,-i,o,| ' ' ' ( ) Atât în ( ) cât și în ( ), succesiunea de polinoame obținută folosind algoritmul E peste numere întregi este în esență aceeași ca în ( ) Singura diferență este că polinoamele sunt înmulțite cu unele numere raționale Oricare ar fi polinomul, fie el m - x + , - jar + ^x - | sau x* - ^x + |, calculele rămân aceleași Dar orice algoritm care folosește aritmetica rațională tinde să fie mai lent decât algoritmul "în întregime întreg" E, deoarece aritmetica rațională necesită de obicei mai multe calcule de numere întregi gcd la fiecare pas pentru polinoamele de grade mari Este instructiv să comparăm ( ), ( ) și ( ) cu ( ), unde am determinat mcd-ul acelorași polinoame u(x) și v(x) modulo cu mult mai puțin efort Deoarece £(m) și £(v) nu sunt multipli ai lui , faptul că mcd(u(a:), v[x)) = mod este suficient pentru a demonstra că u(x) și v(x) coprim peste inelul numerelor întregi (și, prin urmare, peste câmpul numerelor raționale) Vom reveni la această observație care economisește timp la sfârșitul secțiunii Algoritmul Collins Un algoritm ingenios care depășește algoritmul E în general și, în plus, oferă informații despre comportamentul algoritmului E, a fost dezvoltat de George E Collins (George E Collins) [JACM ( ), - ] și îmbunătățit ulterior de W C Brown (WS Brown) şi J F Traub (JF Traub) [JACM ( ), - ; vezi, de asemenea, WS Brown, ACM Trans Matematică Software ( ), - ] Se evită calcularea părților primitive la pasul E , în schimb împărțirea la un element al lui S cunoscut a fi un factor de r(m) Algoritmul C [Căutarea celui mai mare divizor comun în regiunea unei descompunere unică] Acest algoritm folosește aceleași ipoteze de intrare și date de ieșire ca în algoritmul E Are avantajul că căutarea celor mai mari divizori comuni ai coeficienților necesită mai puține calcule C [Reducere la polinoame primitive ] Ca în pasul E al algoritmului E, setați d ) C [Adăugarea conținutului ] Reveniți ca răspuns d • pp(v(a:)) | Dacă aplicăm acest algoritm polinoamelor considerate anterior ( ), atunci obținem Această secvență de rezultate este citită la începutul pasului C u(t:) v(x) h , , , ,- ,- , , ,- , , , , - , - , , , - , - - , - ( ) - , - , , - - , - - La sfârșitul algoritmului, r(x)/ghs = Această secvență de polinoame constă din polinoame întregi multiple în secvența obținută de algoritmul E În ciuda faptului că polinoamele nu sunt reduse la o formă primitivă, coeficienții rămân în limite rezonabile datorită factorului de reducere din pasul C Pentru a analiza algoritmul C și a demonstra corectitudinea acestuia, se consideră șirul de polinoame u(x), u(x), u(x), obținute cu ajutorul acestuia, unde ui(x) = u(x) și U (x) = v(x) Fie j = nj - rij+i pentru j > , unde nj = deg(uj), și fie qi = hi = , gj = £(uj), hj = h*^ gf pentru j > Atunci gp+ ui(x) = U (x)qi(x) + g hi u (x), pz ^ a$ au ao din a a ai ao din au din din ad a a ai ao В Шз Ш Ш Ши bo Вз b Ь Ьи Ьз Ь Ьи Ьо v b bg Ьи Ьз Ь Ьи Ьо Ви бз бз би бз б би бо Во коО жз жз жи жз ж жи жо / = M ( ) Operațiile specificate cu rânduri și permutări de rânduri conduc la transformarea matricei M în LA Vz LA Ві C Сі Asa de Do /b b b b b b b °\ b b b b b b b b b b b b b bs bi bs b bi b с сз С Сі Сo Сі Сз С Сі сo с сз С С с \ d di do/ ( ) În conformitate cu modul în care a fost obținută matricea M' din M, avem b ■ b • b • (с?/b|) • det Mo = ± det Mț, dacă Mo și Mq sunt orice matrice pătrată obținută prin alegerea a opt coloane corespunzătoare din M și M' De exemplu, să alegem primele șapte coloane și coloana care conține di; Apoi b • b • I • (c^/bg) • det / az au Despre " hell Oz a ca ау аз аз G аз ао az ay az d ai b bs bi bs b b b b b bі bz b bі b b bz b b b b \ bz bz bі bі/ = ±bț • с ■ di Deoarece C / , acest lucru demonstrează că di este un număr întreg În mod similar, d și do sunt numere întregi Nume șir String Â în urmă o? Uq as L az Ol ao a ag la Mb a aț a ai Az ca - Az A ag ca , az AI ag ca O Ao ag Og as B fi b b b bg bi bo ve bb bs b b b bl bo b bo bs b b b bl bo b bo bs b b b bl Sz be bs b b bg b b bs b b Bg bo bs b Bo bo bs C C C c Ci Co c C cs C Ci Sz C C C C C C Сi C Co D la Ao și de la Bni-nj la Bo, și executați cele indicate în Tabel operații pe rânduri, puteți obține o matrice M' formată din rânduri dispuse într-o anumită ordine de la VP -p, conform VPz-Pi + i, apoi - de la SP -P, conform SP -p> + i, , din Рп, -п, n Рі, din n Qo și, în final, Ro (rândul care conține coeficienții aj+ (x)) Extragând coloanele corespunzătoare, arătăm că (" + ei^')П "Пі+ (^ + ^^ )nz'n>+ - • • (^' + ^-i^J )n> ni+ x det Mo = ±g?~Pzd?~P d^G"''d^^P, ( ) unde rt este un coeficient dat wj + i(x), iar Mo este o submatrice a lui M mod (vezi exercițiul ) - astfel încât această ecuație să fie simplificată la det Mo = ±rf ( ) Prin urmare, fiecare coeficient iij + i(x) poate fi exprimat ca determinant al unei matrice de dimensiune (nj + n - rij + ) x (nj + n - rij + ), ale cărei elemente sunt coeficienții o(x) și v(x) Rămâne să arătăm că h alese în acest fel sunt și numere întregi Aplicam urmatoarea tehnica: consideram, de exemplu, matricea " Ao Vz B Br În / o> Od av az ad az a ai ao \ O Oț O Oz Oq b bz b bx bo oo oo oo Despre bz bz b bі bо O O О Ьв Ьз Ьз Ь Ьи Ьо О \ O O Ьв Ьз Ь Ьз Ь Ьи Ьо / ( ) Operațiunea nad strokami, definită în tabel , i perestanova strok privedut k matrice Vz V V Wow Si Asa de / Ье Ьз Ь Ьз Ь Ьи Ьо О > О Ье Ьз bl Ьз Ь Ьи Ьо О О O Ье Ьз Ьи Ьз Ь Ьи Ьо O O O Ье Ьз Ь Ьз Ь Ьи Ьо O O O O C sz s si so O \ O O O O O C sz s si so / ( ) prin urmare, dacă luăm în considerare orice submatrice Mo și M$, obținute prin alegerea celor șase coloane corespunzătoare M și M', putem obține b| ■ b| • det Mo = ± det Mq - Când Mo este ales să fie primele șase coloane ale lui M, obținem că det Mo = ±c%/bI = ±/іz, deci /іz este un număr întreg În general, pentru a arăta că hj este un număr întreg pentru j > , începem cu o matrice M formată din rândurile An nj i până la A și Bni nj-i până la Bo; apoi vom efectua operatiile corespunzatoare pe randuri pana obtinem matricea M', formata din randuri de la VP PI la VPZ-p , apoi - de la Cn + nj i la SP P , , de la Pnj nj i faţă de Po şi cu Qn^i-nj-i faţă de Qo tâ+ / ihțT -nj ( S + / h^ns-ni • • ■ (g^/gj-ih^i )">""> det Mo = ±g^-n g^ > ( ) iar ecuația se simplifică grațios la det Mo = ±L ( ) (Deși această dovadă este dată pentru domenii de numere întregi, se aplică în mod evident oricărui domeniu de descompunere unică ) În procesul de verificare a algoritmului C, am constatat, de asemenea, că fiecare element al lui S de care ne-am ocupat în algoritm poate fi exprimat ca determinant cu elemente care sunt coeficienți ai părților primitive ale polinoamelor originale Cunoscuta teoremă Hadamard (vezi exercițiul ) spune că | det(a )| dacă și numai dacă există un determinant similar compus din coeficienții u(x) și ѵ(x) este egal cu zero Întrucât un astfel de determinant este un polinom diferit de zero în multe variabile de coeficienți, va fi diferit de zero "aproape întotdeauna" sau "cu probabilitate " (vezi exercițiul pentru o formulare mai precisă a acestei afirmații și a demonstrației aferente din exercițiul ) ) În exemplele de polinoame din ( ), ), apoi ca rezultat al aplicării algoritmului C la ( :) = w(x)ui(x) și ѵ(х) = w(x)u (x) rezultă succesiunea w(x) ( :), w(x)U (x), t w(x)u (x), t w(x')u (x), , ( ) unde t = £(w) (vezi exercițiul ) În ciuda prezenței acestor factori ^ suplimentari, algoritmul C va depăși algoritmul E, deoarece lucrul cu polinoame puțin mai mari este mai ușor decât calcularea constantă a părților primitive Secvențele reziduale, cum ar fi cele obținute în algoritmii C și E, sunt utile pentru mai mult decât pentru a găsi cei mai mari divizori comuni și rezultate O aplicație importantă este enumerarea rădăcinilor reale ale unui polinom dat într-un anumit interval conform celebrei teoreme a lui J Sturm (J Sturm) [Met Presentes par Divers Savants (Paris, ), - ] Fie ( :) un polinom peste câmpul numerelor reale cu rădăcini complexe diferite Veți învăța în secțiunea următoare că rădăcinile sunt distincte dacă și numai dacă gcd( ( :),u ( :)) - , unde n'( :) este derivata lui ( :); deci există un adept * Pentru o mai mare claritate, prezentăm forma completă a rezultantei celor două polinoame aoxm + aigm + • ■ • + am și boxn + bіgn + + bn: dm - &t ao ai ag Despre Ofl Nt O De la- Nt O Oh, oh det DESPRE • • • bo bu br Despre bo bu br Oh ao ai bp - bp O bp - bp O ao ai ag O • • De la- Nt Oh, oh DESPRE bo bu br • bp - bp (Vezi, de exemplu, Korn G , Korn T Handbook of mathematics (pentru oameni de știință și ingineri) - M : Nauka, , secțiunea ) - Notă, trad resturile, demonstrând că polinomul u(x) este relativ prim cu u'Qr) Presupunând u (m) = u(x), u(x) = u'(x) (și după Sturm), schimbăm semnul tuturor resturilor obține cju (t) = u(x)di(x) - diu (x), C Uj(t) = (x) ( :) - ^ "s(x), ( ) CkUk-i(x) = Uk(x)qk(x) - dkUk+i(x) pentru unele constante pozitive Cj și dj, unde deg(ufe+j) = Spunem că abaterea V(u,a) a polinomului u(x) în a este egală cu numărul de modificări de semn din șirul u (a), uj(a ), u,+i(a), fără a număra zerourile De exemplu, dacă șirul de semne este , +, -, -, , +, +, -, obținem V(u, a) = Teorema lui Sturm afirmă că numărul de rădăcini u(x) din intervalul a Fie m > n Dacă u(x) și v(x) sunt polinoame normalizate , distribuite independent și uniform între toate perechile pm+n de polinoame normalizate de grade m și respectiv n, atunci care sunt valorile medii ale celor trei mărimi t, ni + • • • + nt și (n - u)Пі + • • • + (nt- - nt)nt, exprimat ca funcții ale lui m, n și pi (Aceste trei mărimi sunt principalii factori care afectează timpul de rulare a algoritmului euclidian cu polinoame modulo p, presupunând că împărțirea este realizat cu ajutorul algoritmului D ) [Indicatie Arătați că u(x) mod v(x) este distribuit uniform și independent de v(x) ] [M ] Care este probabilitatea ca u(x) și v(x) să fie relativ prime modulo p dacă u(x) și v(x) sunt polinoame normalizate, distribuite uniform, independente de gradul nі [M ] Am văzut că algoritmul lui Euclid A pentru numere întregi poate fi convertit într-un algoritm pentru găsirea celui mai mare divizor comun al polinoamelor Este posibil să convertiți algoritmul de căutare binar gcd B într-un algoritm de căutare polinomială într-un mod similar? [МІО] Care sunt elementele inversabile din domeniul tuturor polinoamelor din domeniul unei descompunere unică S ► [M ] Să se arate că, dacă un polinom cu coeficienți întregi este ireductibil în domeniul numerelor întregi, el este și ireductibil atunci când este considerat peste câmpul numerelor raționale [M ] Fie u(x') și v(x) polinoame primitive pe un domeniu de descompunere unică S Demonstrați că u(x) și v(x) sunt coprime dacă și numai dacă polinoamele U(x) și V(x) peste S sunt astfel încât u(x)V(x) + t/(x)v(x) este un polinom de grad zero [Indicaţie Extindeți algoritmul E deoarece algoritmul A a fost extins în exercițiu ] [M ] Demonstrați că polinoamele dintr-un domeniu de descompunere unică formează un domeniu de descompunere unică [Indicaţie Utilizați rezultatul ex pentru a arăta că există cel mult o descompunere posibilă ] [Af ] Ce rânduri ar apărea în tabel , dacă succesiunea de grade ar fi , , , , -oo, și nu , , , , , ? ► [M ] Fie u(x), ua(x), m (x), o succesiune de polinoame obținute în timpul operației algoritmului C Matricea Sylvester este o matrice pătrată construită din rânduri cu AP -i conform Ao și de la Vp i la Bo (în notație similară cu cele pentru Tabelul ) Să se arate că dacă mJ) și U ((r)) au un factor comun pozitiv, atunci determinantul matricei Sylvester este zero și invers: să se arate că dacă pentru unele k deg(ufc) = , atunci determinantul lui Matricea Sylvester este diferită de zero (arătați că, derivând o formulă pentru valoarea sa absolută în termeni de £(uj) și deg(uj, deg(v) + și deg(v) > deg(r) + , atunci r(x) este un multiplu al £(v) [M ] Demonstrați inegalitatea lui Hadamard ( ) [Indicaţie Luați în considerare matricea AAG [ ► [M ] Fie f(xi, ,zn) un polinom în multe variabile care nu sunt identic zero și fie r( i, ,Sn) mulțimea rădăcinilor (xi, , xn) din ecuația /((r)i, , xn) = , astfel încât zi Si, , xn Sn- Dacă gradul lui f nu depășește dj caractere a = a\ an, unde fiecare % e A Lungimea lui a, scrisă ca |a|, este egală cu numărul de caractere n Polinomul șirurilor peste alfabetul A este suma finită U = rb ab, unde fiecare r* este un număr rațional diferit de zero și fiecare ai este un rând peste alfabetul A; presupunem că aj / ca j / k Gradul de U, deg(LT'), este definit ca -oo dacă U = (adică dacă suma este goală); altfel deg(u) = max|afc| Suma și produsul polinoamelor șir sunt definite într-un mod evident Deci, (ȘV rjQj)(Ș k sk@k) = unde produsul Cele două șiruri se obțin prin simpla concatenare a acestora; după aceea devin membri ai sumei De exemplu, dacă A = {a, b}, U = ab + ba - a - b și V = a + b - , atunci deg(t/) = , deg(V) = , V = aa + ab + ba + bb - a - b + și V - U = aa + bb + l Este clar că deg(tTV) = deg(( )+deg(V) și deg(I +V) deg(V') astfel încât deg(Qi[ - Q V) deg(Qif - Q V) pentru unele Qi și Q Arătați că rezultatul itemului (a) poate fi îmbunătățit pentru a găsi un coeficient Q astfel încât U = QV + R, deg(TÎ) deg(V' ) Să se arate că există un polinom uniform de șiruri U astfel încât U = UiU și Vi = UV d) Date polinoame omogene de șiruri U și V cu UV =■ VU Demonstrați că există un polinom de șir omogen W astfel încât U = rlVm, V = slVn pentru unele numere întregi m, n și numere raționale r, h Dezvoltați un algoritm pentru a calcula W, care are cel mai înalt grad posibil (Acest algoritm este interesant, de exemplu, când U = a și V = / sunt rânduri care satisfac relația a/ = / ; atunci W este doar un rând Când U = xm și Y = xn, soluția cu cel mai mare grad este șirul W = xgcd'rn,n\ deci acest algoritm include ca caz special algoritmul pentru găsirea numerelor întregi gcd ) ► [M ] (Algoritmul lui Euclid pentru polinoame de șir ) Fie V) și Vr polinoame de șir care nu sunt simultan egale cu zero și au un multiplu stâng comun (aceasta înseamnă că există polinoame șiruri Ui și U care nu sunt simultan egal cu zero, astfel încât Ui V = t/r Vr) Scopul acestui exercițiu este de a găsi un algoritm pentru calcularea celui mai mare divizor drept comun al acestora NCPD(Vi, Vr) și cel mai mic multiplu comun stâng al LCL(V), Vr) Aceste mărimi sunt definite după cum urmează: NAPD(Vi, Vg) este divizorul drept comun al lui V) și Vg (adică, Vi = VV NOPD(Vi, Vg) și Vg = VVgNOPD(Vi, Vg) pentru unele Wi și VVg), și orice divizor drept comun al lui V) și Vg este un divizor drept al NCPD(Vi, Vg); HOJIK(Vî, Vr) = Z V = Z V pentru unii Zi și Dr și orice multiplu stâng comun al lui Vi și Vr este un multiplu stâng al lui NOLK(V'i, Vr) De exemplu, fie Ui = abbbab + abbab - bbab + ab - , Vi = babab + abab + ab - b; U \u d abb + ab - b, Vg \u d bababab + bababab + babab + abab - babb - Apoi avem - bbabab - babab + bbabb - abb - ab + b Pentru aceste polinoame de șir, se poate arăta că NOPD(Vi, Vr) = ab+ și NOLK(Vi, Vr) = Ui Vi Algoritmul de împărțire din ex poate fi formulat astfel: dacă Vi și Vr sunt polinoame șir, și Vr / și dacă Ui / și Tr satisfac relația Li Vi = U V , atunci există polinoame șir Q și R astfel încât Vi = QV + R, unde grade(B) sunt multipli ai mcd(^(u), £(r)) și explicați cum să îmbunătățirea algoritmului C în conformitate cu aceasta ► [M ] Scopul acestui exercițiu este de a găsi un analog pentru polinoame al faptului că o fracție continuă cu numere întregi pozitive oferă cea mai bună aproximare a numerelor reale (Ex - ) Fie u(x) și v(x) polinoame peste un câmp cu deg(u) > deg(v) și fie aAm), ar(x), polinoame parțiale rezultate din aplicarea algoritmului euclidian la u(x) și v(x) De exemplu, succesiunea de câte în ( ) și ( ) este m + , x + , m + m + m+ , x+ Este necesar să arătăm că reprezentările рп(х)/qn(x) ale fracției continuate //аі(т), aа(т), // sunt "cele mai bune aproximări" ale puterilor mici ale raționalului funcția ѵ(х)/u(х ), unde pn(m) = A"n-i(a (x), ■• ,a"(t)) și qn(x) = Kp(ai(x), ,a"(x )) sunt continuanții din -( ) Prin definiție, po(x) = q~i(x) = , p i(x) = qo(x) = Demonstrați că dacă p(x) și q(x) sunt polinoame astfel încât deg(q) , atunci torul (m ) = cpn-i(m) și q(x) = cqn i(x) pentru o constantă c În special, fiecare qn(x) este un polinom de record, în sensul că nu există un polinom diferit de zero q(x) de grad mai mic, astfel încât pentru orice polinom p(x) polinomul p(x )u(x) ) - q(x)v(x) a avut același grad mic ca pn(m)u(m) - qn(x)v(x) [M ] Propuneți o modalitate de a accelera împărțirea lui u(x) la v(t), dacă se știe dinainte că restul va fi zero * Factorizarea polinoamelor Luați în considerare acum problema nu numai a găsirii celui mai mare divizor comun a două sau mai multe polinoame, ci și a expansiunii polinoamelor Modul de extindere p Ca și în cazul numerelor întregi (Secțiunile și ), problema de descompunere este mult mai dificilă decât găsirea celui mai mare divizor comun Cu toate acestea, extinderea polinoamelor modulo un număr întreg prim p nu este atât de dificilă pe cât pare Este mult mai ușor să găsiți factorii unui polinom arbitrar de gradul n modulo decât să folosiți orice metodă cunoscută pentru a găsi factorii unui număr binar arbitrar de n biți Această situație neașteptată este o consecință a unui algoritm de descompunere instructiv descoperit în de Elwyn R Berlekamp [Beli System Technical J ( ), - ] Fie p un număr prim; toate operațiile aritmetice pe polinoame din următorul material sunt efectuate modulo p Să presupunem că este dat un polinom u(x), ai cărui coeficienți sunt aleși din mulțimea { , , , p - } Noi putem presupune că u(x) este normalizat Scopul nostru este să exprimăm u(x) sub forma s(x) =p (x)ei pr( :)e'-, ( ) unde pi(x), , Pr(x) sunt diverse polinoame ireductibile normalizate Ca un prim pas, se poate folosi tehnologia standard pentru a determina dacă orice exponent ei, , de exemplu, este mai mare decât unu Dacă u(x) = uxn + ■■ ■ + u = v(x) w(x), ( ) atunci derivata (găsită ca de obicei, dar modulo p) va fi egală cu u'(x) = iwna:n + • • • + u = v(x)v' (x)w(x) + v(x) w'(x), ( ) iar această expresie este un multiplu al lui ѵ(x) Deci primul nostru pas în extinderea u(x') ar trebui să fie găsirea gcd(w(a:),w'( :)) - d(x) ( ) Dacă d(x) este egal cu , atunci, după cum tocmai am văzut, u(x) este pătrat liber, adică este produsul numerelor prime distincte Pi(x) p(x) Dacă d(x') nu este egal cu și d(x) / u(x), atunci d(x) este un factor propriu al u(x); relația dintre factorii d(x) și factorii u(x)/d(x) accelerează procesul de expansiune pentru acest caz (vezi Exercițiile și ) Și în sfârșit, dacă d(x) = u(x), atunci este necesar ca u'(x) = ; prin urmare, coeficientul lui xk este diferit de zero numai dacă k este un multiplu al lui p Aceasta înseamnă că u(x) poate fi scris ca un polinom de forma v(xp) În acest caz avem u(x) = v(xp) = (v(a:))p ( ) Procesul de descompunere poate fi finalizat prin găsirea factorilor ireductibili și (g) și ridicarea lor la puterea p Identitatea ( ) poate părea oarecum ciudată pentru cititor, dar este un fapt important care stă la baza algoritmului Berlekamp și a altor metode, despre care vom discuta puțin mai târziu Se poate dovedi astfel Dacă vi(x) și v (x) sunt niște polinoame modulo p, atunci (vi(x)+v (i:))P = ѵi(x)₽ + (f)vi(x)p v (x)-I-h (pPj)"i(x)v (x)p~ + v (x)p = W(x)p + v (x)p, întrucât coeficienții binomi (((), , ( sunt multipli ai p În plus, dacă a este un întreg arbitrar, avem ap = a (mod p) conform teoremei lui Fermat Astfel, când ѵ(x) = ѵtxm + ѵt іхt ~ + - - t'o, găsim că v(x)p = (vmxm)p + (v^x(tm)- )" + • • • + (vo)p ~ vmxmp + vm^lx pt -b" = v(xP) Aceste observații arată că problema de descompunere se reduce la problema de descompunere pentru polinoame fără pătrat Deci, să presupunem că u(x) - p (x)p (x) pr(x) ( ) este produsul mai multor factori primi La ce truc ar trebui să se recurgă pentru a putea găsi pDx) dacă este dat doar u(x)? ideea lui Berlekamp constă în aplicarea teoremei chineze a restului, care este valabilă pentru polinoame în același mod ca și pentru numere întregi (vezi exercițiul ) Dacă (zi, sz, •, sz) este o mulțime arbitrară de r numere întregi modulo p, din teorema chineză a restului rezultă că există un polinom unic v(x) astfel încât w(x) = (modulo P (x)), , v(x) = Sr (modulo Pr(x)), deg(v) și z i / z i obținem gcd(u(a:), v(x) - zi) divizibil cu pi(x), dar nu nar?(x) Deoarece aceste observații arată că informațiile despre factorii u(x) pot fi obținute din soluțiile corespunzătoare v(x) ( ), analizăm ( ) cu mai multă atenție În primul rând, putem vedea că polinomul v(x) satisface condiția v(xY = sj = Sj = v(x) (mod pDx)) pentru reduceți problema la o descompunere a u(x), așa cum sa menționat mai devreme în această secțiune LA Construiți matricea Q definită de ( ) și ( ) Acest lucru se poate face în unul din două moduri, în funcție de cât de mare este p, așa cum se explică mai jos VZ "Triangularizați" matricea Q - I, unde I = ( ij) este matricea de identitate de dimensiunea n × n, găsiți rangul ei n - r și găsiți vectori liniar independenți iD ), , uM, astfel încât iDYA ( Q - I ) = ( , , , ) pentru vor fi efectuate numai când aCjJ = - și toate celelalte elemente ale rândului Cj sunt zero ) N [Buclă peste fc ] Efectuați pasul N pentru k = , , , n - , apoi terminați algoritmul N [Verificarea dependenței șirurilor ] Dacă există j din intervalul ; dacă j = k; in caz contrar | ( ) Cel mai bine este să ilustrați mecanismul acestui algoritm cu un exemplu specific Fie A matricea QI din ( ) peste câmpul numerelor întregi modulo Pentru k = se obține vectorul rA ) = ( , , , , , , , ) Pentru k - la pasul N , j poate fi luat egal cu , , , , , sau ; alegerea aici este complet arbitrară, deși va afecta forma vectorilor produși de algoritm Când se calculează manual, este cel mai convenabil să se ia j = , deoarece dis = - - Operațiile pe coloane din pasul N transformă matricea A în matrice / °\ (c) , ' / (Elementul încercuit de la intersecția coloanei și a rândului este folosit aici pentru a indica faptul că c = Amintiți-vă că algoritmul N numește rândurile și coloanele matricei începând de la , nu de la ) Când k = , se poate alegeți j = și obțineți în mod similar următoarele matrice cu același nucleu ca Q - I k = (° \ (c) (c) \c / k = ( °\ (c) (c) (c) \ u/ k = ( °\ (c) (c) (c) X / k = / \ ( ) (r) (r) (r) @ ' / Acum fiecare coloană care nu are un element încercuit este complet nulă; deci pentru k = și k = algoritmul oferă încă doi vectori și anume: = ( , , , , , , , ), ѵ[ ] = ( , , , , , , , ) Din forma matricei A după a cincea transformare reiese clar că acești vectori satisfac ecuația ѵА = ( , , ) Deoarece calculul produce trei vectori liniar independenți, u(x) trebuie să aibă exact trei factori ireductibili În cele din urmă, puteți trece la pasul B al procedurii de descompunere Calculând gcd(w(a:), ѵU(m) - h) pentru / - dacă și numai dacă = mod p Se știe exact că (p - )/ numere întregi în intervalul și p > Astfel, nu este o idee rea să înlocuiți pasul B cu următoarea procedură (cu excepția cazului în care p este mic): ), unde coeficienții ay sunt aleși aleatoriu în intervalul ; să înlocuim u(x) cu d (x)-(u (x)/d (x)) și să creștem valoarea lui t după fiecare mcd non-trivial găsit Vom repeta procesul pentru diferite variante ale lui v(x) până când obținem t = r Presupunând că sunt necesare doar O(logr) soluții aleatoare v(x) ale ecuației ( ) (ceea ce este destul de acceptabil), atunci putem specifica o limită superioară a timpului necesar pentru a executa această alternativă la pasul B Este nevoie de d ) Dacă d+ > | deg(v), execuția procedurii se oprește deoarece fie ѵ(х) = , fie ѵ(х) este un polinom ireductibil În caz contrar, măriți d cu și înlocuiți w(x) cu w(x)p mod v(x) D Găsiți gd(x) = mcd(w(s) - x, v(a:)) (Acesta este produsul tuturor factorilor ireductibili u(x) ale căror puteri sunt d ) Dacă da(x) / , înlocuiți v(x') cu v(x)/gd(x) și w(x) cu w (x ) mod v(x) Dacă gradul gd(x) este mai mare decât d, utilizați algoritmul de mai jos pentru a găsi factorii săi Reveniți la pasul D eu Această procedură vă permite să determinați produsul tuturor factorilor ireductibili cu gradul d și, astfel, să aflați câți factori de un anumit grad există Deoarece cei trei factori din exemplul nostru de polinom ( ) au grade diferite, toți pot fi găsiți fără a extinde polinoamele gd(x) Pentru a finaliza metoda, este nevoie de o cale care să ofere capacitatea de a împărți polinomul gd(x) în factori ireductibili atunci când deg(gd) > d Michael Rabin a demonstrat în că acest lucru se poate face folosind operații aritmetice pe un câmp de elemente pd David G Cantor și Hans Zassenhaus au descoperit în că există o modalitate și mai simplă bazată pe următoarea identitate: dacă p este un număr prim impar, atunci avem d(x) = mcd(gd( :), i(x)) mcd^z), i(m)(p când sunt utilizate numai polinoame liniare t(x) De exemplu, există opt non- polinoame f(x') de gradul modulo şi pentru toate în mod diferit calculați mcd(/(a;), (x + s) - ) pentru oo când w este gradul de înmulțire "rapidă" a matricei în ex - [Cm J Simbolic Comp ( ), - ; Matematică Comp ( ), - ] Referințe istorice Ideea de a găsi toți factorii liniari ai polinomului fără pătrat f(x) modulo p calculând mai întâi g(x) - gcd(x/? - , f(x)) și apoi gcd(p(a) :), ( a: + s)(p l/ ±l) pentru s arbitrare a fost afirmat de A M Legendre (A M Legendre), Memoires Acad Sci Paris ( ), - Motivul a fost căutarea pentru toate soluțiile întregi de ecuații diofantine de forma f(x) = py, adică f(x) = (modulo p) Tehnica mai generală de separare a puterii încorporată în algoritmul D a fost descoperită pentru prima dată de C F Gauss (S F Gauss) ) până în , dar nu a fost publicată [vezi al său Werke ( ), ], iar apoi de Evariste Galois în lucrarea acum clasică care a devenit baza teoriei câmpurilor finite [Bulletin des Sciences Mathematiques, Physiques et Chimiques ( ), - , retipărit în J de Math Pures et Appliquees ( ), - ] Cu toate acestea, aceste lucrări ale lui Gauss și Galois au fost înaintea timpului lor și nu au fost înțelese până când J A Serret (J A Serret) nu a dat puțin mai târziu o interpretare detaliată [Memorii Acad sci Paris, seria , ( ), - ; algoritmul D este în § ] Proceduri speciale de împărțire a ffd(x) în factori ireductibili au fost dezvoltate succesiv de diverși autori, dar o metodă universală care ar rămâne eficientă pentru p mari, aparent, nu a fost descoperită până la apariția calculatoarelor care au necesitat dezvoltarea ei Primul astfel de algoritm randomizat cu analiză riguroasă a timpului de rulare a fost publicat de Berlekamp [E Berlekamp, Matematică Comp ( ), - ] A fost îmbunătățită și simplificată de Robert T Moenck, Math Comp ( ), - , M O Rabin, SICOMP ( ), - , și DG Cantor și HJ Zassenhaus, Math Comp ( ), - ] Paul Camion a descoperit independent o generalizare pentru clase speciale de polinoame în multe variabile [Comptes Rendus Acad sci Paris A ( ), - ; IEEE ITans IT- ( ), - ] Numărul mediu de operații necesare pentru a extinde un polinom aleator modulo p a fost analizat de P Flajolet, X Gourdon și D Panario, Lecture Notes in Comp sci ( ), - Descompunerea peste inelul numerelor întregi Sarcina de a găsi o expansiune completă a polinoamelor cu coeficienți întregi, atunci când munca este efectuată nu modulo p, este ceva mai complicată decât cea anterioară, dar chiar și în acest caz există o serie de metode de rezolvare rezonabil de eficiente Isaac Newton a oferit o metodă pentru găsirea factorilor liniari și pătratici ai polinoamelor cu coeficienți întregi în lucrarea sa Arithmetica Universalis ( ) Metoda sa a fost extinsă în de astronomul Friedrich von Schubert, care a arătat cum să găsească toți factorii de gradul n într-un număr finit de pași [cf M Cantor, Geschichte der Mathematik (Leipzig: Teubner, ), - ] L Kronecker a descoperit independent metoda lui Schubert aproximativ de ani mai târziu, dar, din păcate, această metodă este extrem de ineficientă pentru n egal sau mai mare de cinci Rezultate mult mai bune pot fi obținute folosind metodele de expansiune modulo p de mai sus Să presupunem că trebuie să găsim factorii ireductibili ai polinomului u(x) = ipXp + ip- XP~ + ■ ■■ + Uo, ip / , peste inelul de numere întregi Ca un prim pas, se poate împărți la cel mai mare divizor comun al coeficienților polinomi; ca urmare, lucrul va continua cu un polinom primitiv De asemenea, putem presupune că u(x) este fără pătrat (împărțindu-l la mcd(u(;r), u'(z)), ca în exercițiul ) Acum, dacă u(x) = v(x)w(x), unde fiecare dintre polinoame are coeficienți întregi, avem evident u(x) = v(t)w(t) (mod p) pentru toate p prime , deci există o factorizare non-trivială modulo p, cu excepția cazului în care p împarte qi) Un algoritm eficient pentru factorizarea u(x) modulo p poate fi astfel utilizat pentru a încerca să reconstruiască o posibilă factorizare a u(x) pe un inel de numere întregi De exemplu, lasa u(x) = x + x - m - x + m + x - ( ) Am văzut deja în ( ) că u(x) = (m + m + m + x + )(m + m + x + )(m + ) (modulo ), ( ) și extinderea completă a lui u(x) modulo arată prezența a doi factori: unul de gradul și celălalt de gradul (vezi Exercițiul ) Din ( ) se poate observa că u(x) nu are factori de gradul , deci trebuie să fie ireductibil peste inelul de numere întregi Acest exemplu special a fost probabil prea simplu; experiența arată că majoritatea polinoamelor ireductibile pot fi recunoscute ca atare prin examinarea factorilor lor modulo mai multe numere prime, dar este departe de a fi întotdeauna ușor de stabilit ireductibilitatea De exemplu, există polinoame astfel încât să poată fi factorizate corect modulo p pentru toate p prime cu puteri consistente ale factorilor, dar sunt ireductibile peste inelul de numere întregi (vezi exercițiul ) O familie mare de polinoame ireductibile este considerată în Ex , iar în ex se demonstrează că aproape toate polinoamele sunt ireductibile peste inelul numerelor întregi Cu toate acestea, de obicei nu încercăm să factorăm polinoame aleatoare; probabil că există vreun motiv să ne așteptăm ca un polinom să aibă un factor non-trivial, așa că ne interesează o metodă pentru determinarea factorilor atunci când aceștia există În cazul general, nu este ușor să găsiți factorii u(m) luând în considerare expansiunile lui u(x) în diverse module prime De exemplu, dacă u(x) este produsul a patru polinoame pătratice, atunci apar dificultăți în potrivirea imaginilor lor cu diferite module prime Prin urmare, este recomandabil să alegeți un număr prim și să vedeți câte informații pot fi obținute folosindu-l, mai ales dacă factorii modulo acestui număr prim par să aibă puterile potrivite O idee este de a folosi ca modul un număr prim foarte mare, suficient de mare încât coeficienții oricărei expansiuni corecte u(x) = v(x)w(x) peste inelul de numere întregi să fie de fapt în intervalul -p/ la p/ Atunci toți factorii întregi posibili pot fi obținuți din factorii calculați prin metoda cunoscută de noi modulo p În ex arată cum să obțineți o estimare bună a limitelor coeficienților factorilor polinomi De exemplu, dacă ( ) este reductibilă, atunci factorul său ѵ(x) are gradul De fapt, expansiunea totală modulo este (x + ) (t + ) (t - t - ) (t - t - t + t - ), și vedem imediat că niciunul dintre polinoamele rezultate nu poate fi factori ( ) peste inelul de numere întregi, deoarece termenii constanți nu împart În plus, nu există nicio modalitate de a găsi divizorul ( ) prin gruparea a doi dintre factori rezultați, deoarece niciunul dintre termenii constanți găsiți x , x (- ), x (- ) nu sunt egali cu ± sau ± (modulo ) Determinarea limitelor bune ale coeficienților factorilor polinomi nu este o sarcină trivială, deoarece pot apărea un număr mare de reduceri în procesul de înmulțire a polinoamelor De exemplu, polinomul aparent inofensiv xn - are factori ireductibili ai căror coeficienți depășesc exp(n //|glg") pentru un număr nedefinit de n [Vezi R C Vaughan, Michigan Math J ( ), - ] Exercițiul este dedicat extinderii polinomului xn - În loc de un prim mare p, care poate fi uriaș dacă u(x) are un grad mare sau coeficienți mari, se poate folosi și p mic, cu condiția ca u(x) să fie fără pătrat mod p În acest caz, pentru a extinde expansiunea modulo p în mod unic la expansiunea modulo pentru un exponent e arbitrar mare, putem folosi o construcție importantă cunoscută sub numele de lema lui Hensel (vezi exercițiul ) Dacă aplicăm lema lui Hensel la ( ) cu p = și e = , obținem o expansiune unică u(x) = (x - )(m - m + m - )(m + m - Ut + m + ) (modulul ) Notând acești factori ca i (m)din(m)u(m), vedem că nici r>i(m) și u (m) nu sunt factori ai u(m) peste inelul întregului și nici produsul lor u(m)u ( m ) cu coeficienți redusi modulo la intervalul (-^,^) Deci, am folosit orice ocazie pentru a demonstra că u(m) este ireductibil peste inelul de numere întregi - de data aceasta folosind doar expansiunea lui modulo Exemplul considerat mai sus nu este tipic într-un aspect important: polinomul normalizat u(x) din ( ) a fost extins, deci putem presupune că toți factorii săi sunt normalizați Ce să faci în cazul în care un > ? Într-o astfel de situație, coeficientul conducător al unuia dintre factorii polinomului poate varia modulo pe aproape arbitrar; cu siguranță nu vrem să luăm în considerare toate posibilitățile disponibile Probabil că cititorul a observat deja această problemă Din fericire, există o cale de ieșire simplă: expansiunea u(x) = v(x)w(x) implică extinderea uu(x) = ѵi(x)u\ (x), unde ^(vi) = ^( wi) = un = £(u) ("Scuzați-mă, v-ați amintit că v-am înmulțit polinomul cu factorul de conducere înainte de expansiune?") Acum puteți proceda în același mod ca mai sus, folosind pe > B, unde B limitează coeficientul maxim al multiplicatorului upi(x ), și nu lor) O altă modalitate de a rezolva problema coeficientului conducător este discutată în Ex Să combinăm toate materialele luate în considerare în următoarea procedură F Găsiți singura descompunere fără pătrat u(x) = t(u)Vi(x) vr(m) (modulo pe), unde pe este suficient de mare, așa cum sa explicat mai sus, și unde Vj(x) este un polinom normalizat (Acest lucru va fi posibil pentru unele numere prime p; vezi exercițiul ) Setați și d F Pentru fiecare combinație de factori v(m) = Vjj(x) -Vid(x) c = , dacă d - ^m, construiți un polinom unic v(x) = t(u)v(x) (modulo pe ), ai căror coeficienți sunt în intervalul [-|pe |pe) Dacă v(x) împarte t(u)u(x), se calculează factorul pp(u(a:)), se împarte u(x) la acesta, se elimină factorul corespunzător potrivirea vi (x) din lista de factori modulo pe, micșorați r cu numărul de factori eliminați și terminați algoritmul dacă d > |r F Creșteți d cu și reveniți la pasul F dacă d B să fie îndeplinită, unde B este limita coeficienților oricărui divizor upi(x) dar poate fi folosită o valoare mult mai mică a lui B, atâta timp cât se garantează că este adevărată pentru divizorii | deg(u) B poate fi redus și mai mult asigurându-se că B limitează coeficienții a cel puțin unui divizor valid u(x) (de exemplu, atunci când factorizarea unui întreg compus N în loc de polinom, unii divizori pot fi foarte mari, dar cel puțin unul dintre ei va fi | deg(u) Un alt mod important de a accelera procedura este reducerea lui r astfel încât să reflecte numărul real de factori Algoritmul de factoring de putere prezentat mai sus poate fi aplicat la diferite numere prime mici pj Astfel, pentru fiecare număr prim se obține o mulțime de puteri imposibile ale factorilor modulo pj (vezi exercițiul ) Se poate reprezenta Dj ca un șir de n biți Acum calculăm intersecția f}Dj, adică AND pe biți a acestor rânduri și efectuăm pasul F numai pentru deg(ij) + ■ ■ • + deg(irf) e Q Du În plus, p este ales astfel încât pj să aibă cea mai mică valoare a lui r Această tehnică a fost dezvoltată de David R Musser, care, pe baza experienței sale, și-a propus să testeze aproximativ cinci numere prime pj [vezi JACM ( ), - ] Desigur, ar trebui să se oprească imediat dacă intersecția curentă P| Dj arată că polinomul u(x) este ireductibil Musser a oferit o discuție completă a unei metode de descompunere similară cu cea descrisă mai sus în JACM ( ), - Pașii F -F sunt combinați într-o îmbunătățire propusă în de G E Collins Constă în găsirea divizorilor de probă obținând simultan combinații de factori d în loc de combinații cu o putere comună a lui d Această îmbunătățire este importantă în legătură cu comportamentul statistic al factorilor polinoamelor modulo p, care sunt ireductibili în câmpul numerelor raționale (vezi Exercițiul ) A K Lenstra (A K Lenstra), X V Lenstra (Jr ) (H W Lenstra, Jr ) și L Lo-vas (L Lovăsz) au propus faimoasa lor expansiune polinomială "algoritm LLL" peste inelul de numere întregi cu limite exacte pe număr de calcule în cel mai rău caz [Math Annalen ( ), - ] Metoda lor nu necesită numere aleatoare, iar timpul său de rulare pentru un polinom u(x) de grad n este deg(d) Din algoritmul E rezultă că acest caz este posibil numai dacă p împarte factorul principal al unuia dintre reziduurile diferite de zero calculate de acest algoritm folosind aritmetica întregului exact; în caz contrar, algoritmul lui Euclid mod p funcționează cu aceeași succesiune de polinoame ca și algoritmul E, cu excepția multiplicității unei constante nenule (mod p) Doar un număr mic de numere întregi "ghinioniste" pot duce la absența celui mai mare divizor comun și, dacă continuați să încercați, veți găsi în curând un număr prim "norocos" Dacă limita coeficientului este atât de mare încât nu există suficiente numere prime cu o singură precizie p, puteți evalua d(x) modulo mai multe prime p până când este determinat folosind algoritmul bazat pe teorema chineză a restului din Secțiunea Această abordare, propusă de W S Brown (WS Brown) şi J E Collins, este descrisă în detaliu în JACM ( ), - În plus, așa cum au recomandat J Moses și DYY Yun, Proc ACM Conf ( ), - , se poate folosi metoda lui Hensel pentru a determina d(x') modulo pe pentru e suficient de mare Construcția lui Hensel pare computațional superioară abordării teoremei chineze a restului, dar acest lucru este direct adevărat numai atunci când d(x) ± u(x)/d(x) sau d(x) ± v(x)/d(x), ( ) întrucât ideea este aplicarea tehnicilor din ex la una dintre expansiunile f(d)u(x) = q(x)ui(x) sau £(d)v(x) = q(x)vi(x) (modulo p) În ex și arată că, dacă este necesar, cu ajutorul unei permutări, ( ) poate fi îndeplinită (Record u(x) ± u(x), ( ) folosit în ( ) înseamnă că u(x) și v(x) sunt coprime, prin analogie cu notația folosită pentru numerele coprime ) Algoritmul cel mai mare divizor comun prezentat în această secțiune este mult mai rapid decât algoritmul din Secțiunea , cu excepția cazului în care succesiunea resturilor polinomiale este foarte scurtă Poate că o procedură generalizată mai bună ar începe prin a calcula mcd(u(;r), u(m)) modulo un număr prim mic p care nu este atât un divizor al t(u) cât și al t(v) Dacă rezultatul este q(x) = , am terminat; dacă are un grad ridicat, folosim algoritmul C În caz contrar, aplicăm una dintre metodele descrise mai sus, calculând mai întâi limita pe coeficienții d(x) pe baza coeficienților u(x) și u(m) și a gradului mic al polinomului q(x) Ca și în problema factorizării, dacă cei mai mici coeficienți ai polinoamelor mai simplu decât cele mai vechi, este necesar să se aplice această procedură la polinoamele "inversate" u(x), ѵ(x) și se inversează rezultatul Polinoame în multe variabile Astfel de metode conduc la algoritmi utili pentru factorizarea sau găsirea celor mai mari divizori comuni ai polinoamelor în mai multe variabile cu coeficienți întregi Este convenabil să se lucreze cu polinomul u(xi, ,xt) modulo polinoamele ireductibile x -a , ,xt~at, care în acest caz joacă rolul lui p din materialul considerat mai devreme Deoarece v(x~) mod (x - a) = v(a), valoarea "(ac, ,x , probabilitatea ca u(x) să aibă un factor liniar modulo p este între ( +p )/ și ( +p~ )/ inclusiv Dați forma exactă a acestei probabilități pentru n > p Care este numărul mediu de factori liniari? ► [M ] (a) Arătați că orice polinom normalizat u(x) peste un domeniu al unei descompunere unică poate fi reprezentat în mod unic ca u(x) = v(x) w(x), unde w(x) este fără pătrat (nu are factori de grad pozitiv de forma d(x) ) și ambele polinoame v(x) și w(x) sunt normalizate (b) (E R Berlekamp) Câte polinoame normalizate de grad n sunt fără pătrat mod p unde p este un număr prim? [A/ ] (Teorema chineză a restului pentru polinoame ) Fie ui(rr), u(m) polinoame peste un câmp S, unde u(x) ± Uk(x) pentru toate j / k Demonstrați că pentru orice polinoame date wi(x), , wr(x) peste S există un polinom unic v(x) peste S astfel încât deg(v) > dacă Da și numai dacă g(z) = p(n)/(zn)/n ] Ce este ІІШр-уо Def/r [IMZO] Fie APR numărul mediu de factori ireductibili ai aleatoriei alese sub forma unui polinom de gradul n modulo un număr prim p Arătaţi că Iipir-yuo Apr = Np Care este valoarea medie limită G, unde i este numărul de ireductibile multiplicatorii mei? [M ] (JL Lagrange, ) Dovediți identitatea ( ) [Indicaţie Extinde xp - x într-un câmp de p elemente ] [M ] Demonstrează ( ) [HM ] Cum să vă asigurați că vectorii obținuți la ieșirea algoritmului N sunt liniar independenți? [ ] Explicați cel mai simplu mod de a construi un tabel de reciproce modulo , având în vedere că este rădăcina primitivă a lui ► [ ] Găsiți extinderea completă modulo a polinomului u(x) din ( ) folosind procedura Berlekamp [ ] Aflați expansiunea completă a polinomului u(x) din ( ) modulo ► [M ] Folosiți algoritmul lui Berlekamp pentru a afla numărul de factori u(x) = x + modulo p pentru toate p prime [Indicaţie Luați în considerare cazurile în care p = , p - k - , p = k + , p - k + , p = k + , separat Cu ce este egală matricea Q? Nu trebuie să găsiți multiplicatorii; trebuie doar să le găsiți numărul ] [M ] Continuând exercițiul anterior, găsiți formule exacte pentru factorii polinomului x + mod p pentru toate numerele prime impare p folosind mărimile , n/ , n/- dacă astfel de rădăcini pătrate există mod p [M ] (H Zassenhaus) Fie v(x) o soluție a lui ( ) și fie w(x) = JJ(x - s), unde produsul este preluat pe toți ] b) Arătați că orice câmp cu pn elemente are un element "rădăcină primitivă" £ astfel încât elementele câmpului să fie { , , £, £ , , £p"~ } [Indicație În exercițiul - conține o dovadă pentru cazul special n = ] c) Dacă /(x) este un polinom ireductibil modulo p de gradul n, demonstrați că xpm - x este divizibil cu /(x) dacă și numai dacă m este un multiplu al lui n f(x) este ireductibil modulo p dacă și numai dacă xpn - x este divizibil cu /(x) și xp"lq -r f(x) pentru toate numerele prime q care împart n ) [M ] Fie F un câmp cu de elemente Câte elemente ale lui F au ordinul f pentru fiecare număr întreg -j = sk]crds j,k J ' p,q> r,s> VJ/' = Ei! E [p+ ="]m" E [ch+r="]bchsg- i> p,s> q,r> b) Un polinom u(x) = Ș^jUjx se numește polinom omogen de grad n dacă fiecare termen are un grad comun n Astfel, Sj = n pentru uj φ Se consideră suma ponderată a coeficienților B(u) = j! |uj| Folosind elementul (a), arătați că JB(u) > JB(v)B(w) dacă u(x) = v(x)w(x) este omogen c) Norma Bomberi [u] a unui polinom u(x) se definește ca yB(u)/n!dacă u este un polinom omogen de grad n Se definește și pentru polinoamele neomogene prin adăugarea unei noi variabile xt +i și înmulțind fiecare termen cu gradul xt +i- astfel încât și să devină omogen fără a crește gradul său maxim De exemplu, fie u(x') = x + x - ; polinomul omogen corespunzător este m + xy - r/ și [u] = ( ! ! + ! ! I + ! ! )/ ! = + + Dacă u(x, y, z) = xy - z , obținem în mod similar [u] = ( ! ! ! ! + ! ! ! ! )/ ! = | + e Ce spune partea (b) despre legătura dintre [u], [v] și [w] pentru u(x) = v(x)w(x)? d) Demonstrați că dacă u(x} este un polinom reductibil de grad n într-o variabilă, atunci are un factor ai cărui coeficienți nu depășesc n! ,z',[u] ,z /(n/ )! Care este valoarea corespunzătoare pentru polinoamele omogene în t variabile? e) Calculați [u] explicit și asimptotic pentru u(x) = (x - )n f) Demonstrați că [u][v] > [uv] g) Să se arate că p/ A/(u) , ve(x) este un polinom normalizat, deg(a) cx? [M ] Fie g(x} produsul a două sau mai multe polinoame ireductibile distincte de gradul d modulo un număr prim impar p Demonstrați că mcd(p(z), - ) va fi un factor propriu g(x) cu probabilitate > / - l/( pd) pentru orice g(x} fix când t(x) este ales aleatoriu dintre polinoamele p d de grad Să se arate că există un număr n(p, d) cu următoarele două proprietăți: (i) Pentru toate numerele întregi t exact n(p, d) polinoamele ireductibile q(x) de gradul d modulo p satisfac relația (x + ()(pd-!)/ mod q(x} - (ii) p, d) de polinoamele ireductibile q(x} de grad d modulo p satisface relația e(g) [MZO] {Polinoame ciclotomice } pentru m + |un- І + • ■ • + |io|, sau (un i = și un- > + |un- | + • • • + |io|)- Arătați că polinomul u{x ) este ireductibil peste inelul de numere întregi [Indicaţie Demonstrați că aproape toate rădăcinile și sunt mai mici de în valoare absolută ] [HM ] (David G Cantor ) Să se arate că, dacă un polinom u(x) este ireductibil peste inelul de numere întregi, atunci are o dovadă "scurtată" a ireductibilității în sensul că numărul de biți din demonstrație este cel puțin un polinom în deg(u) și lungimile coeficienților (Aici, este necesară o limitare a lungimii probelor, ca în exercițiul - , și nu o limitare a timpului necesar pentru a căuta astfel de dovezi ) Sugestie Dacă v(x) este ireductibil și t este orice polinom peste inelul de numere întregi, atunci toți factorii w(£(x)) au grad > deg(v) Criteriul Perron oferă o mare cantitate de polinoame ireductibile ѵ(x) [M ] (P Sh Wang (P S Wang) ) Dacă un este coeficientul conducător al polinomului u(x) și B este limita coeficienților unui factor u, atunci algoritmul de descompunere dat în textul secțiunii necesită găsirea unei expansiuni modulo pe, unde pe > [un[B Dar |un I poate fi mai mare decât B când B este selectat folosind metoda din ex Arătați că dacă polinomul u(x') este reductibil, atunci există o modalitate de a recupera unul dintre factorii săi adevărați din expansiunea modulo p', când p' > B , folosind algoritmul din exercițiu - [MJ ] (Beauzamy, Trevisan și Wang ) Demonstrați sau infirmați următoarele: există o constantă c astfel încât dacă f(x) este un polinom întreg cu coeficienți, în valoare absolută care depășește B, atunci unul dintre ireductibilii acestuia factorii are coeficienți limitați de cB Calculul puterii În această secțiune, considerăm o problemă interesantă - calculul eficient al lui xn dat x și n, unde n este un întreg pozitiv Să presupunem, de exemplu, că doriți să calculați x (r) Puteți începe pur și simplu cu x și îl înmulțiți cu x de ori Dar același răspuns poate fi obținut în doar patru înmulțiri prin pătrarea rezultatului de mai multe ori, calculând succesiv x , x , xs, x b Aceeași idee, în general, se aplică oricărei valori a lui n în felul următor Să scriem n ca număr în sistemul numeric binar (eliminând zerourile din stânga) Apoi înlocuiți fiecare " " cu o pereche de caractere SX, fiecare " " cu un caracter S și tăiați perechea cea mai din stânga de caractere "SX" Rezultatul este o regulă pentru calcularea xn, în care "S" este tratat ca operație de pătrat și "X" ca operație de înmulțire cu x De exemplu, n = are o reprezentare binară de Astfel, formăm secvența SXSSXSXSX, din care scoatem perechea SX inițială pentru a obține regula finală SSXSXSX Această regulă spune că este necesar să "pătrat, pătrat, înmulțire cu x, pătrat, înmulțire cu x, pătrat și înmulțire cu x", adică să se calculeze succesiv valorile x , x , x , x , x , x , x Această metodă binară poate fi justificată cu ușurință prin analizarea succesiunii puterilor în calcul: considerând fiecare "S" ca operație de înmulțire cu , iar "X" ca operație de adunare a și pornind de la , și nu de la x, vom ajunge la calculul lui n conform cu proprietăţile sistemului de numere binar Această metodă este foarte veche; a apărut înainte de î Hr e în Chandah-sutra clasică hindusă din Pingala [vezi p B Datta și A N Singh, History of Hindu Mathematics (Lahore: Motilal Banarsi Das, ), ] Se pare că pentru următorul mileniu această metodă nu a fost menționată nicăieri în afara Indiei În anul d Hr e al-Uqlidisî (al-Uqlîdisî) din Damasc a explicat clar cum să se calculeze eficient n pentru n arbitrar Vezi The Arithmetic of al-Uqlidisî de AS Saidan (Dordrecht: D Reidel, ), - pentru idei generale ilustrate pentru exemplu, n = Vezi și Cronologia națiunilor antice a lui al-Bîrunî, tradusă și editată de E Sachau (Londra, ), - Această lucrare arabă a secolului a avut o influență puternică asupra dezvoltării matematicii Orez Calcularea xn pe baza scanării notației binare n de la dreapta la stânga Metoda binară "S și X" pentru obținerea xn nu necesită memorie suplimentară, cu excepția memoriei pentru stocarea x și a rezultatului intermediar curent și, prin urmare, este convenabilă pentru implementarea hardware pe un computer binar Metoda este ușor de programat, dar necesită scanarea reprezentării binare a lui n de la stânga la dreapta, în timp ce programele de calculator o fac de obicei în direcția opusă, datorită faptului că operațiile disponibile de împărțire la și preluare a restului de ieșire modulo reprezentarea binară a numărului de la dreapta la stânga Prin urmare, următorul algoritm bazat pe scanarea numărului de la dreapta la stânga este adesea mai convenabil Algoritmul A (metoda de exponențiere binară de la dreapta la stânga) Acest algoritm (Fig ) calculează valoarea lui xn, unde n este un număr întreg pozitiv (aici x aparține oricărui sistem algebric în care este definită înmulțirea asociativă cu elementul de identitate ) AI [Inițializare ] Setați N n,Y , Z , xn poate fi găsit calculând xp și ridicând această valoare la puterea lui q Dacă n este un număr prim, puteți calcula xn și îl puteți înmulți cu x Și, desigur, pentru n = obținem xn fără calcule Aplicând în mod repetat aceste reguli, se poate obține o procedură pentru calcularea xn pentru orice valoare dată a lui n De exemplu, pentru a găsi x ') trebuie mai întâi să calculăm y = x° - x x = (x ) x și apoi să construim y = y y = (y ) y Întregul proces presupune efectuarea a opt înmulțiri, în timp ce metoda binară ar necesita nouă înmulțiri Metoda multiplicatorului depășește în medie metoda binară, dar în unele cazuri (cel mai mic dintre ele este n = ) metoda binară este mai bună Metoda binară poate fi generalizată la metoda t-ary după cum urmează Fie n = dom + dimt + ■ ■ ■ + dt, unde al căror dj apar în reprezentarea lui n, iar acest lucru ne scutește adesea efortul ) Apoi ridicăm xd° la puterea lui m și înmulțim cu xdl Astfel am calculat yi - xd°m+dl apoi ridicăm yi la puterea lui m, înmulțim cu xd și obținem y = xd°m + dim+^ acest proces continuă până când se calculează valoarea yt = xn Când dj = , desigur, înmulțirea cu xdj nu este necesară Rețineți că această metodă pentru m = se reduce la metoda binară "de la stânga la dreapta" discutată mai devreme, dar metoda mai puțin clară m-ary "de la dreapta la stânga" necesită mai multă memorie și ceva mai mulți pași (vezi Exercițiul ) Dacă m este un număr prim mic, metoda m-ary va fi deosebit de eficientă pentru calcularea puterilor unui polinom modulo altul atunci când coeficienții sunt considerați modulo m conform -( ) O metodă sistematică care oferă numărul minim de înmulțiri pentru toate valorile relativ mici ale lui n (în special, pentru majoritatea valorilor lui n întâlnite în aplicațiile reale) este ilustrată în fig Pentru calcul găsiți n în arborele prezentat în figură; calea de la rădăcina arborelui la n oferă succesiunea exponenților întâlniți în calculul eficient al lui xn Regula prin care se construiește acest "arborele de grade" este dată în exercițiu Testele de calcul au arătat că arborele de putere oferă rezultate optime pentru toți n indicați în figură, totuși, pentru valori suficient de mari ale lui n, metoda arborelui de putere nu este întotdeauna optimă (cele mai mici exemple de neoptimalitate sunt n = , , ) Prima valoare pentru care arborele de putere depășește atât metoda binară, cât și metoda multiplicatorului este n = Prima valoare pentru care metoda multiplicatorului depășește metoda arborelui de putere este n = - • Astfel de cazuri sunt destul de rare (Pentru n ei > • • • > et > ( ) Să definim acum două funcții auxiliare pentru comoditatea următoarei discuții conducere: A(n) = [IgnJ; ( ) i/(n) = numărul de în reprezentarea binară n ( ) Astfel, A( ) = , i/( ) = Aceste funcții pot fi definite prin următoarele relații recursive: A( ) = , A( n) = A( n + ) = A(n) + ; ( ) p( ) = , m( n) = i/(n), i/( n + ) - v(n) + ( ) Folosindu-le, putem scrie că lanțurile aditive binare pentru n necesită exact A(n) + i/(n) - pași, iar ( ) ia forma /(n) Dacă pasul r este o dublare, atunci = ar i ; deci n f = A(n)+s( / )/, întrucât d + f = A(n) + s și Fj+ Prin urmare, / ) și ( ) rezultă din faptul că п / p ( / ) (r) , | Valorile lui Z(n) pentru n special Este ușor de arătat prin inducție că a, Plgnl ( ) Această limită inferioară, împreună cu limita superioară ( ) obținută prin metoda binară, dă valorile ( a) = A; / ( L + B) \u d A + dacă A > B ( ) ( ) Cu alte cuvinte, metoda binară este optimă când p(n) B > C ( ) Dovada De fapt, se poate dovedi un rezultat mai riguros, care va fi folosit mai târziu în această secțiune Toate lanțurile de aditivi cu exact un pas mic aparțin unuia dintre următoarele șase tipuri (aici, toți pașii indicați cu " " sunt dublări) Tipul , , a, a + d, , a+c + B+C; A > B > , C > Tipul , , a, a + d, L+ + d, , A+C+ + B+C; A > B > , C > Tip , , L, a + L , L + + - " , L + , , A + C; A> , C> Tipul , , a, a + a , n+ + a, a+ , , A+C; A > , C > Tip , , a, a + a , , a+c + a+c , a+c+ + A+C~ , a+c+d+ + A+C+I)- ; A > , C > , D > Tipul , , a, a + d, L+ , , L+S; A > B > , C > Calculele directe arată că aceste șase tipuri epuizează toate posibilitățile Conform corolarului teoremei A, există cel mult trei nedubleri în prezența unui pas mic; acest maxim apare numai în succesiunea celui de-al treilea tip Toate lanțurile de mai sus sunt stelare, cu excepția tipului , când B | (E de Jonquieres în a subliniat fără dovezi că f(n) > A(n) + când v(n) > Teorema B a apărut pentru prima dată în lucrarea lui A A Gioia, M V Subbarao și M Sugunamma, Duke Math J ( ), - ) Calcularea l( A + B + e + D) pentru A > B > C > D este mai dificilă Conform metodei binare, această valoare nu depășește A + , iar în conformitate cu demonstrația teoremei B, nu este mai mică de A + Valoarea A + este admisibilă, deoarece se știe că metoda binară nu este optim pentru n = sau n = După cum vom vedea acum, pentru i/(n) = putem da o definiție completă a comportamentului acestei mărimi Teorema C Dacă v(ti) > , atunci (n) > A(n) + cu excepția următoarelor cazuri când A>B>C>Dh ( a + B + e + d) este egal cu A + Cazul A - B = C - D (Exemplu: n = ) Cazul A - B = C - D + (Exemplu: n = ) Cazul A - B = , C - D = (Exemplu: n = ) Cazul A - B = , B - C = C - D = (Exemplu: n = ) Dovada Când /(n) = A(n) + , există un lanț aditiv pentru n care are doar doi pași mici Constă dintr-unul dintre cele șase tipuri enumerate în demonstrația teoremei B, un pas mic și o secvență de pași non-mici Spunem că n este "special" dacă n = A + B + e + D pentru unul dintre cele patru cazuri enumerate în teoremă Este posibil să se obțină lanțuri aditive de forma dorită pentru fiecare n special, așa cum se arată în exercițiu , deci rămâne de demonstrat că nu există lanțuri cu exact doi pași mici care să conțină elemente cu i/(ai) > , cu excepția ai-ului special Numim un lanț-contraexemplu un lanț aditiv cu doi pași mici, astfel încât p(ar) > , dar ar nu este special Dacă există un lanț contraexemplu, atunci considerăm lanțul = ao , cu excepția unui n special Mai mult, pasul r nu este o dublare, întrucât contraexemplul mai scurt ar fi un lanț ao, ■ ■ ■, ar i În cele din urmă, pasul r este un pas stea, deoarece în caz contrar lanțul ao, , ar , ar ar fi un lanț contraexemplu mai scurt Prin urmare, ar = ar-i + ar-k, k > , uA(ar) = A(ar i) + ( ) Să desemnăm numărul de transferuri care au loc la adăugarea ar i și ar k în sistemul numeric binar conform algoritmului IA, ca c Folosind relația fundamentală i/(ar) = z/(ar !) + i/(ar fc) - c, ( ) se poate dovedi că pasul r - nu este mic (vezi Exerciţiul ) Fie m = A(ar i) Deoarece nici r, nici r - nu este un pas mic, c > ; egalitatea c = poate fi valabilă numai când ar i > m + m~ Acum să presupunem că r - nu este o treaptă stea Atunci r - este un pas mic și ao, , ar s, ar i este un lanț cu un singur pas mic Prin urmare, p(ar i) Dacă k = , atunci q > și ao, ai, , ar , ar , ar r + ar ? = ar este un contraexemplu al unei secvențe pentru care k > Prin urmare, putem presupune că k > Acum să presupunem că A(ar *) = m - Cazul când A(ar fc) m + m și p(ar i) = Trebuie să existe cel puțin două transferuri atunci când se adună numerele ar r și ar i - ar Prin urmare, p( ar r) = și ar (fiind special u > |ar i) are forma m + m~ -f- d+ + d pentru unele d Acum ar i este fie m+ m- + d+ + d, fie m+ m - d+ + d+ , iar în ambele cazuri ar trebuie să fie m + m- , deci ar se referă la cazul | E G Türber [Pacific J Math ( ), - ] a extins Teorema C pentru a arăta că i(n) > A(n) + pentru n(n) > Pare rezonabil să presupunem că i(n) > A(n) + lgz/(n) în cazul general, întrucât A Schonhage a fost foarte aproape de a demonstra acest fapt (vezi Exerciţiul ) *Valori asimptotice Din teorema C rezultă că obținerea valorilor exacte ale lui i(n) pentru n mare este, aparent, o problemă foarte dificilă Cu toate acestea, este posibil să se determine comportamentul aproximativ al funcției în cazul limită când n oo Teorema D (A Brauer, BuII Amer Math Soc ( ), - ) lim Г(п)/А(п) = lim Z(n)/A(n) = ( ) n->oo n->oo Dovada Lanțul aditiv ( ) pentru metoda ^-ary are formă de stea dacă eliminăm din el toate aparițiile secunde ale fiecărui element care apare de două ori în lanț Dacă ai este primul element dintre do, d , din al doilea rând, care este absent în primul rând, avem cc Afirmația teoremei se poate obține dacă, de exemplu, alegem k = L|lgA(n)J eu Dacă punem k = AA(n) - AAA(n) în ( ) pentru n mare, unde AA(n) înseamnă A(A(n)), obținem o limită asimptotică mai strictă /(n) ( + /(n)A(n)/AA(n)) = ( ) (A se vedea definiția probabilității "Pr" în secțiunea ) Dovada Limita superioară ( ) arată că ( ) este îndeplinită fără semne ale valorii absolute Limita inferioară rezultă din teorema E dacă punem următoarele: f(n) scade la zero suficient de lent încât pentru f(n) ei > • • • > e , și fie = dg x > ej - mj pentru tot x ∈ Mj ( ) Studiul nostru asupra structurii lanțurilor de stele se termină cu construcția multimulților Mu, în care este înregistrată istoria lui Mj Multisetul Si este împărțit în t + multiseturi, după cum urmează: a) Mrj = Mj; b) dacă di+i = dt, atunci Mij = - l = {xl|a:GM(i+i),}; c) dacă di+i =di +dk, k x>ej+di~d - mj pentru toate x e My ( ) Ca exemplu de construcție atât de detaliată, luăm în considerare lanțul stelar , , , , , , , pentru care t = , r = , d = , f = Obținem următoarea mulțime de multiseturi ez = , tpz = er = , r = ei = , ti = Co = , m = Astfel, LDo = { , }, etc Din construcție se poate observa că di este cel mai mare element, prin urmare, di € MiQ ( ) Cea mai importantă parte a acestei structuri rezultă din ( ) și una dintre consecințele ei imediate este K Lema K Dacă Mij și Miѵ conțin ambele un număr comun x, atunci -mv eii > • • ■ > e Dacă e > ei + (i - ) și vi-i > e, + t pentru , deoarece rezultatul teoremei este adevărat pentru t £ x> A(a m, ( ) adica exista cel putin m+l dublari intre treptele u si i: daca di - du ei + di - d, atunci x G Mio și x G Mi conform ( ), deci din Lema K rezultă că |di - du\ A(Oi\ și, prin urmare, pasul i este un pas mic Acum să deducem faptul cheie din toată această demonstrație: toate elementele lui Su sunt elemente ale lui Myo ■ Într-adevăr, dacă nu este cazul, fie x un element al lui Su, astfel încât x $ Myo- Deoarece x > , este din ( ) rezultă că ei > d - du şi eo = f + d - a Totuși, du G Su, în conformitate cu ( ) și nu poate fi în L Prin urmare, du Xj > eo + du - d - m ( ) Acum, pentru tot j = , , , t, este definit un număr Xj care satisface ( ) și un mic pas i, la care termenul e este introdus în lanțul aditiv Dacă j / j', pasul r la care se întâmplă acest lucru nu poate fi același atât pentru j, cât și pentru j' Din ( ) rezultă că \xj-Xj> | trebuie să difere cu mai mult decât m, deoarece e;- și e^ • • • > xi > și y > ■ ■ ■ > yv > O- Primii pași ai lanțului sunt puteri succesive de până la atingerea valorii a~Ui; între acești pași, valorile suplimentare sunt introduse în locurile corespunzătoare XV-' - Zh", Zh~ - Zh"~ - Zh, ei Ajunși la lanțul A ~ Yi - m ( Y "Y - Și y, ~ a ') continuăm construcția, adunând x și dublând suma rezultată yt - yi + i ori și obținem a-î/-+i + x( yi yi+ + - + Y, Y^ ) Dacă această construcție este efectuată pentru i = , , , r, presupunând, din motive de comoditate, că Yv+i = , obținem lanțul aditiv necesar pentru A -xy | Teorema F face posibilă găsirea valorilor lui n pentru care /(n) fix, dacă exponenţii bo >■■■>et sunt suficient de diferiţi [CreLe ( ), - ] Câteva presupuneri Deși la prima vedere este rezonabil să presupunem că (n) - *(n), am văzut că nu este adevărat O altă presupunere plauzibilă, făcută mai întâi de A Goulard și "demonstrată" de E de Jonquieres în L'Intermed des matematică ( ), - , este că ( n) = Dublarea este atât de eficientă încât nu este posibil astfel încât ar putea exista un șir mai scurt pentru n decât șirul obținut prin adăugarea dublării la cel mai scurt șir pentru n este atât de dificil să găsiți un lanț de stea cu lungimea pentru , de exemplu, , , , , , , , , , , , Numărul este minimul de numere astfel încât (n) = și demonstrând manual că /( ) > este foarte netrivial Astfel, demonstrarea computerizată a autorului a acestui fapt folosind metoda backtracking, care va fi discutată în Secțiunea , necesită un studiu detaliat a de cazuri ) Cele mai mici patru valori ale lui n astfel încât ( n) = ( n) sunt n = , , , E G Türber a demonstrat în Pacific J Math ( ), - că a treia dintre aceste numere este un membru al unei familii infinite de astfel de n, și anume, - k + pentru toate k > Pare rezonabil să presupunem că /( mr) > / (mr), dar chiar și asta poate fi fals Kevin R Hebb a arătat că f(m) - (m) poate fi arbitrar mare pentru toate numerele întregi fixe m care nu sunt puteri ale lui [Notă Amer Matematică soc ( ), A- ] Cea mai mică valoare pentru care /(mn) ca r -> oo Valorile enumerate aici pentru r > au fost calculate de Achim Flammenkamp, cu excepția valorii c( ) calculată de Daniel Bleichenbacher Flammenkamp a observat că c(r) este bine aproximat prin formula r exp(-br/lgr) pentru > - ) pentru și fiecare vârf, cu excepția chiuvetei, are un grad de ieșire > În schimb, orice astfel de graf direcționat fără cicluri direcționate corespunde cel puțin unui lanț aditiv, deoarece este posibil să sortați topologic vârfurile și să scrieți d - pași suplimentari pentru fiecare vârf al gradului de intrare d > Lungimea lanțului aditiv, excluzând pașii neutilizați pot fi determinați prin vizualizarea graficului de mai sus Ea este egală (număr de arce) - (număr de vârfuri) + , ( ) deoarece ștergerea unui vârf de gradul de ieșire șterge și un arc Două lanțuri aditive sunt echivalente dacă au același grafic redus De exemplu, lanțul aditiv , , , , , , , , , este echivalent cu lanțul discutat la începutul acestei secțiuni deoarece se reduce și la graficul ( ) Acest exemplu arată că un lanț non-stea poate fi echivalent cu un lanț de stele Un lanț aditiv este echivalent cu un lanț stea dacă și numai dacă graficul său direcționat redus poate fi sortat topologic într-un singur mod O proprietate importantă a unei astfel de reprezentări grafice a lanțurilor aditive este indicată de N Pippenger: eticheta fiecărui vârf este exact egală cu numărul de căi orientate de la sursă la acest vârf Astfel, problema găsirii lanțului aditiv optim pentru n este echivalentă cu problema minimizării valorii ( ) pe toate graficele direcționate care au o sursă și un canal și exact n căi direcționate de la sursă la chiuvetă Această caracteristică are o consecință surprinzătoare în legătură cu simetria unui graf direcționat Dacă direcțiile tuturor arcelor sunt inversate, sursa și absorbantul sunt inversate și se obține un alt grafic direcționat, corespunzător setului de lanțuri aditive pentru aceeași valoare a lui n Aceste lanțuri aditive au aceeași lungime ( ) ca și lanțul original De exemplu, dacă extindem toate săgețile din ( ) de la dreapta la stânga și etichetăm vârfurile în funcție de numărul căi de la vârful vecin din dreapta, obținem Unul dintre lanțurile stelare corespunzătoare acestui grafic direcționat redus este , , , , , , , , , : poate fi numită duală în raport cu lanțul aditiv inițial În ex și discută implicații importante ale acestei reprezentări grafice și principiul dualității EXERCIȚII [ ] Care este valoarea lui Z la sfârșitul algoritmului A? [ ] Scrieți un program MIX pentru algoritmul A care calculează x" mod w pentru numerele întregi date n și x, unde w este dimensiunea cuvântului mașină Se presupune că MIX are operațiile binare SRB, JAE etc , descris în Secțiunea Scrieți un alt program care calculează i "modw secvențial (prin înmulțire multiplă cu x) și comparați timpul de rulare al acestor programe ► [ ] Cum se calculează x folosind (a) metoda binară, (b) metoda ternară, (c) metoda cuaternară (cuaternară) și (d) metoda multiplicatorului? [M ] Aflați numărul n pentru care metoda octală ( -ary) dă cu zece înmulțiri mai puține decât metoda binară ► [ ] prezintă primele opt niveluri ale arborelui de grade Presupunând că nivelul k-lea al arborelui este construit, nivelul său (k + )-al-lea este definit după cum urmează: luăm fiecare nod n la nivelul k-lea de la stânga la dreapta și îi atașăm noduri de jos n + , n + ai, n + aa, , n + ab-i = n (în această ordine), unde , ai, ar, ■ ■ •, n-i este calea de la rădăcina arborelui la nodul n Cu toate acestea, aceasta elimină toate nodurile care au apărut deja în arbore Dezvoltați un algoritm eficient care construiește primele r + niveluri ale unui arbore de putere [Indicaţie Utilizați două matrice de variabile, LINKU[J] și LINKRfj], pentru oo [M ] Explicați cum să găsiți intervalele A, , A necesare în demonstrația Lemei R [JM ] Fie fi o constantă pozitivă Să se arate că există o constantă a ; se demonstrează de asemenea că { m - ) + n - -(ign); vezi ( ) și ( ) ) [ ] În lanţul cu adunare şi scădere, în locul regulii ( ), există regula la = aj ± ak- Calculatorul imaginar descris în textul secţiunii este echipat cu o nouă operaţie - SUB (În practică, aceasta corespunde utilizării atât a înmulțirii, cât și a diviziunii pentru a calcula xn ) Găsiți un astfel de lanț pentru unele n care are mai puțin de (n) pași [MJ ] (D H Lehmer) Investigați problema minimizării α + (r - g) în lanțul aditiv ( ), unde g este numărul de pași simpli în care a, = ar -i + , pentru o pondere pozitivă mică dată e (Această problemă este mai aproape de realitate pentru multe calcule xn dacă înmulțirea cu x este mai simplă decât înmulțirea generală; vezi aplicațiile din Secțiunea ) [MZO] (E C Yao (A C Yao), F F Yao (FF Yao) și R L Graham (RL Graham) ) Atribuiți un "preț" ajak pentru fiecare pas a, = aj + aj lanț aditiv ( ) Arătați că metoda binară de la stânga la dreapta conduce la un lanț de cost total minim pentru toate numerele naturale n [ ] Câte lanțuri aditive de lungime are ( ) ca graf direcționat redus? [M ] Lanțul aditiv binar pentru n = e° + ■ ■ ■ + et, când eo > • ■ • > et > , este , , , e° ei, e°~ei + , , eo e + ei e , e°~e + e'"C + , ,n Aceasta corespunde metodei "S și X" descrisă la începutul acestei secțiuni, în timp ce algoritmul A corespunde la lanțul aditiv obținut prin sortarea a două secvențe - ( , , , , e°) și ( e, + e', e'- + e, + e*, , n) -în ordine crescătoare Demonstrați sau infirmați următoarele: fiecare dintre aceste lanțuri de aditivi este dual cu celălalt [M ] Câte lanțuri de aditivi fără trepte care nu sunt utilizate sunt echivalente cu fiecare dintre lanțurile de aditivi discutate în Ex dacă eo > wi + ? [ ] (E G Straus) Găsiți o modalitate de a calcula mononomul generalizat xo'xz x^m în cel mult A(max(n, na, , pt)) + m - m - operații de înmulțire * În original - "baby step" și, respectiv, "close step" - Notă, trad [HM ] (E Ch Yao ) Fie (n, , n) lungimea celui mai scurt lanț aditiv care conține m numere n\ oo în notația din ex ? ► [MS ] (J Olivos, ) Fie i([n , n , , nm]) numărul minim de înmulțiri necesare pentru calcularea mononomului x" ^ • • Zht " * în sensul de ex , unde fiecare pag este un număr natural Demonstrați că această problemă este echivalentă cu problema din Exercițiu , arătând că /([ni, na, , nm]) = /(ni, pz, , nm) + m - [Indicație Generalizați graficul direcționat construind graficul considerat cu mai multe vârfuri sursă ] ► [M ] (X Olivos ) Generalizând metoda multiplicatorului și teorema F, demonstrează că /(minx -I -F mtnt) Pentru seria Fourier când z = eіѲ , avem s = , deci numărul de înmulțiri este redus la n + Iată morala: un programator bun nu va folosi fără discriminare caracteristicile încorporate ale aritmeticii complexe în limbaje de programare de nivel înalt Luați în considerare procesul de împărțire a polinomului u(x) la x - xo folosind algoritmul D pentru a obține u(x) = (x - xg)q(x) + r(x), aici deg(r) n În special, ok} = + ( ) \ / \ / \n/ este un polinom de gradul n din k Alegând corect j, așa cum se arată în exercițiu poate fi aranjat astfel încât valoarea lui a^ să fie valoarea cerută a lui u(xo + kh) pentru toate k Cu alte cuvinte, fiecare n adăugare din ( ) va da următoarea valoare a acestui polinom Avertizare Erorile de rotunjire se pot acumula după mai multe repetări ale lui ( ), iar o eroare în Oj duce la o eroare în coeficienții n: , ,x? polinom calculat Prin urmare, valorile lui aj ar trebui să fie "împrospătate" după un număr mare de iterații Derivate și modificarea variabilei Uneori este necesar să găsim coeficienții u(x + Xo) cu constanta dată Xo și coeficienții u(x) De exemplu, dacă u(x) = x + x - , atunci u(x - ) = x - Yure Acesta este un analog al problemei de conversie a sistemului de numere care convertește baza x în baza x + Prin teorema lui Taylor, noii coeficienți sunt dați de derivatele u(x) în punctul x = Xq, adică u(x + i: ) = u(x ) + u'(x )x + (u"(x )/ !)x h-h (u(n)(x )/n!)xn, ( ) deci problema este echivalentă cu calcularea u(x) și a tuturor derivatelor sale Dacă scriem u(x) = q(x){x - x ) + r, atunci u(x + Xq) = q(x + xq)x + r; în acest caz r este un coeficient constant u(x + xq) și problema se reduce la găsirea coeficienților q(x + xq), unde g(x) este un polinom cunoscut de grad n - Astfel, propunem următoarele algoritm H Atribuiți Vj • a = Ufl - Pm Ps ■ ( ) Această procedură poate fi explicată prin următorul exemplu: să presupunem că trebuie să calculați i: + ІЗя: + i: + ЗЗг - bіа: - i: + Obținem a = , Pi = , r = , bz = - , / = - , / = - și astfel ajungem la ecuația cubică y - y + y + = ( ) Această ecuație are rădăcina Рв - Găsim Pt = - , P = - , ao = , ar = , ai = - , az = , , poate fi calculat conform schemei , Г (uny + osf) y + / , n par, y \u d x + c, w \u d y; z = -c și ( ) vor fi aplicate ori de câte ori an i = un-i - ncun / Este posibil să se definească c în așa fel încât aceste condiții să fie îndeplinite și, de asemenea, ca / m = Se definesc primele n rădăcini ale ecuației u(x) = Dacă a + b este o rădăcină care are cea mai mare sau cea mai mică parte reală și dacă b , atunci punem c = -a si am = -b ; atunci i: - am este un factor al u(x - c) Dacă rădăcina cu cea mai mică sau mai mare parte reală este reală, dar rădăcina cu a doua cea mai mică parte reală (sau a doua cea mai mare) nu este reală, atunci se aplică aceeași transformare Dacă două rădăcini cu cele mai mici (sau mai mari) părți reale sunt reale, atunci ele pot fi exprimate ca a - b și, respectiv, a + b Fie c = -a și am = b ; din nou: - am - factorul u(x - c) (Cu toate acestea, alte valori ale lui c sunt adesea posibile; vezi exercițiul ) Coeficientul an i va fi diferit de zero pentru cel puțin una dintre aceste opțiuni, cu excepția cazului în care q(x) este identic egal cu zero | Rețineți că această metodă de demonstrare dă de obicei cel puțin două valori ale lui c; se poate schimba de la, , am i (m - )! cale Este posibil ca unele dintre aceste opțiuni să fie mai precise decât altele Întrebările legate de precizie, desigur, nu apar atunci când se lucrează cu numere întregi modulo m, dar nu cu numere reale Schema ( ) funcționează pentru n = , când m și u sunt numere coprime, iar ( ) funcționează pentru n - , când m este coprim cu ug și numitorul ( ) În ex arată că înmulțirile n/ + O(logn) și adunările O(n) sunt suficiente pentru orice polinom normalizat de gradul n modulo m *Lanturi de polinoame (lanturi polinomiale) Luați în considerare întrebările de optimitate Care sunt cele mai bune scheme pentru calcularea polinoamelor de diferite grade, exprimate în termeni de număr minim posibil de operații aritmetice? Această problemă a fost analizată pentru prima dată de A M Ostrovsky pentru cazul în care coeficienții nu au fost adaptați anterior (publicat în Studies in Mathematics and Mechanics Presented to R von Mises (New York: Academic Press, ), - ) și T C Motzkin (TS Motzkin) - pentru coeficienți adaptați [vezi Bull America Matematică soc ( ), ] Pentru a investiga această problemă, putem extinde noțiunea de lanț aditiv din Secțiunea la noțiunea de lanț de polinoame Un lanț de polinoame este o succesiune de formă x = Ao, Ai, , Ag = u(i:), ( ) unde u(x) este un polinom în n: u pentru are maximum m grade de libertate Dovada Fie qi, qg, • • •, qt A,-șiruri, care sunt operația de înmulțire Apoi u = S i-i x S i pentru | În ex prezintă un exemplu de construcție conform teoremei M Un rezultat similar poate fi demonstrat pentru adunare Teorema A (E G Belaga, ) Un lanț polinomial care conține q operații de adunare și scădere are maximum g + grade de libertate Dovada [Problems of Cybernetics ( ), - ] Fie ki, , kch șiruri A care corespund operațiilor de adunare sau scădere Apoi kі = ±Т і-і ± Т І pentru , atunci include cel puțin [n/ j + înmulțiri și cu la minim n operaţii de adunare-scădere Dovada Să fie m trepte de înmulțire Prin Teorema M, lanțul are maximum m grade de libertate; astfel, m > n + În mod similar, prin Teorema A, există > n adunări-scăderi | Teorema afirmă că nu există o metodă cu mai puține de ( n/ J + înmulțiri sau mai puține de n adunări) care să poată calcula toate polinoamele posibile de gradul n Rezultatul exercițiului ne permite să întărim această afirmație și să spunem că există nu o colecție limitată de astfel de lanțuri de polinoame care sunt suficiente pentru toate polinoamele de un anumit grad Desigur, unele polinoame speciale pot fi calculate mai eficient; într-adevăr, am demonstrat complet că polinoamele cu coeficienți algebric independenți, în sensul că nu nu satisface o ecuație polinomială netrivială, necesită [n / ] + înmulțiri și n adunări Din păcate, coeficienții cu care ne ocupăm pe calculator sunt întotdeauna numere raționale, deci teoremele de mai sus nu au aplicație reală De fapt, exercițiul arată că întotdeauna se pot realiza înmulțiri O(y/n) (și, cel mai probabil, un număr mare de adunări) Din punct de vedere practic, restricțiile teoremei C din se aplică "aproape tuturor" coeficienților și se dovedesc a fi aplicabili tuturor schemelor de calcul rezonabile Mai mult, se pot obține infime corespunzătoare Teoremei C chiar și în cazul rațional Conform dovezii întărite date mai sus, V Strassen a arătat, de exemplu, că polinomul y(x) = kp xk ( ) k= nu poate fi calculată prin orice lanț polinom de lungime [FOCS ( ), - ] Se știe că discrepanța încă existentă între limita inferioară a teoremei C și numărul real de operații este atinsă în toate situațiile, cu excepția cazului banal când n = Teorema E dă [n/ j -I- înmulțiri, nu [n / ] -I- , deși minimizează numărul de adăugiri Metodele noastre speciale pentru n = și n = au un număr minim de înmulțiri, dar o adunare suplimentară Când n este impar, este ușor de demonstrat că limitele inferioare ale teoremei C nu pot fi atinse simultan pentru înmulțiri și pentru adunări (vezi exercițiul ) Pentru n - , și se poate arăta că sunt necesare cel puțin [n/ ] + înmulțiri În ex și arată că ambele limite inferioare ale teoremei C nu pot fi atinse simultan pentru n = sau n = ; astfel, metodele discutate sunt cele mai bune pentru n par Pan [STOC ( ), - ] stabilește și numărul minim exact necesar de înmulțiri și adunări atunci când calculele se fac în întregime cu numere complexe, și nu cu numere reale pentru toate gradele n În exerciţiu discută o situație interesantă care apare pentru valorile impare ale lui n > Este clar că rezultatele obținute pentru lanțuri de polinoame dintr-o variabilă pot fi aplicate cu ușurință la polinoame cu mai multe variabile De exemplu, dacă trebuie să găsiți schema optimă pentru calcularea unui polinom fără a adapta coeficienții, puteți considera polinomul u(x) ca un polinom în n + variabile x, un, , u, u; în ex arată că în acest caz sunt necesare n înmulțiri și n adunări Într-adevăr, A Borodin [Theory of Machines and Computations, editat de Z Kohavi] și A Paz [New York: Academic Press, , - ] au demonstrat că regula lui Horner ( ) este în esență doar o metodă de calculare a u (x) în n operații fără condiții prealabile Cu mici modificări, metodele de mai sus pot fi generalizate la fel de bine la lanțuri care implică diviziune, adică la funcții raționale, precum și la polinoame Este curios că fracțiile continuate, asemănătoare cu regula lui Horner, s-au dovedit a fi optime din punct de vedere al operațiilor de calcul, dacă vitezele operațiilor de înmulțire și împărțire sunt aceleași, chiar și în condiții suplimentare (vezi exercițiul ) Uneori, împărțirea este utilă în timpul calculului polinoamelor, chiar dacă polinoamele sunt definite doar în termeni de înmulțire și adunare (exemple relevante sunt date în algoritmii Scho-Traub pentru derivate polinomiale) Un alt exemplu este xn + -F x + Deoarece acest polinom poate fi scris ca (xn + - )/(x - ), el poate fi calculat efectuând (n + ) înmulțiri (vezi secțiunea ), două scăderi și o împărțire, în timp ce tehnica de evitare a diviziunii pare să necesite de circa trei ori mai multe operații (vezi exercițiul ) Polinoame speciale în mai multe variabile Determinantul unei matrice de dimensiunea n x n poate fi considerat ca un polinom în n variabile x^, Comp teoretic sci ( ), - ] O altă operație fundamentală legată de matrice, desigur, este înmulțirea matricei: dacă X = (a: y) este o matrice mxn, K = (yjk) este o matrice n x s, iar Z = (z, j,) este o matrice m x s , atunci formula Z = XY înseamnă că P zik = ?xijVjk, =i Această egalitate poate fi privită ca calculul simultan al m polinoame în mn + n variabile; fiecare polinom este "produsul scalar" a doi vectori n-dimensionali Calculul în sine implică înmulțiri m și adunări m (n - ), dar S Winograd a descoperit în că era posibil să înlocuiască aproximativ jumătate din înmulțiri cu adunări: zik - ' (xi, j "b y j - l,&)(• £", j - l "b y j,k) di bk "b xrnyyk impar], bk = ] Y }-l,k Y ],k- ( ) l În plus, doar % din timpul de calcul ar fi fi salvat când n = Pentru aritmetica complexă, situația este oarecum diferită; schema ( ) devine favorabilă pentru n > și economisește % din timp la n = Brent a estimat că schema lui Strassen ( ) nu depășește ( ) atâta timp cât n n, , ,/n ) , n- (sn~i,sn,/n-i)Yi(an,^i, ,in i), /n(Sl, (r) , S , • • • ! (r)n) - *>; /o(^iDgDz) reprezintă coloana "Dat", /i(sz,ii,I ) coloana "Primul pas", etc Ori de câte ori mulțimea de sume poate fi reprezentată în forma ( ) pentru funcții moderat simple gj (sj, ,sn,tj), schema ( ) va reduce numărul de calcule de la ordinul lui N la ordinul lui Y log Y sau cam asa ceva, unde N = mn i mn este numărul de puncte date În plus, această schemă este ideală pentru calculul paralel Un caz special important al transformării Fourier unidimensionale este discutat în Ex și ; cazul unidimensional este dat și în Secțiunea C Să luăm în considerare un caz mai particular de calcul polinomial Polinomul de interpolare Lagrange de ordinul n, pe care îl scriem sub forma , (x-xi)(x-x ) (x-xn) (x-x )(x-x ) (x-xn) [p] Uo(xo-xi)(xo-x ) (xo-xn) Y (X -X )(X -X ) (X -Xn) " (d-Do) (D-D ) - (D-Dp- ), P Sus ((r)p -Xo) (ip-І ) - (xp-Xp- іU este doar un polinom în x de gradul chUp); atunci pentru k = , , , n (în această ordine) atribuiți Oj ch - (aj - aj-i)/(xj - Xj k) pentru j = n, n - , , k (în această ordine) Acest proces necesită |(n + n) împărțiri și n + n scăderi și economisește aproximativ trei sferturi din muncă comparativ cu ( ) De exemplu, trebuie să calculați , ! prin valorile !, !, ! și ! folosind un polinom cubic Rapoartele de diferență sunt egale X La U' U" tu"' DESPRE DESPRE Astfel, U[ ](x) = rx[ ](i) = , U[ ](i) = |x(x- ) + , M[z](i) = |i(i - )(i- ) + ^x(x- ) + Înlocuind x = , în u[z](x), obținem - + + = ; valoarea "corectă" necesară este egală cu Г( , ) = %у/тг " , (Dar există, desigur, multe alte secvențe care încep cu numerele , , și ) Pentru a interpola mai multe polinoame având aceleași puncte de interpolare Xq, xi, , xn, dar valori diferite ale lui yo, yi, , yn, este de dorit să rescriem ( ) în forma propusă de W J Taylor (WJ Taylor) [J Cercetare Nat Vig Standarde ( ), - ]: ( ) și x unde Wfc - l/(*Tfc Xq) [xk Xk-l)(xk Xk+ ) • (xk Xn) ( ) Această formă de ( ) este recomandată și datorită stabilității numerice [vezi R Henrici, EssentiaJs of Numerica! Analiză (New York: Wiley, ), - ] Numitorul ( ) este egal cu rapoartele parțiale ale fracției /(q - Xq)(x - xn) (x - xn) O aplicație importantă și oarecum neașteptată a interpolării polinomiale a fost descoperită de Adi Shamir [CACM ( ), - ], care a remarcat că polinoamele modulo p pot fi folosite pentru "închidere" Cu alte cuvinte, este posibil să se dezvolte un sistem de chei sau parole ascunse astfel încât, cunoscând orice n + chei, se poate calcula eficient numărul magic N, să zicem, deschizând ușa, dar cunoscând orice n chei, este imposibil pentru a obține orice informație despre N Soluția uimitor de simplă a lui Shamir la această problemă este să aleagă un polinom aleatoriu u(x) = uxn -I - ux + Uq, unde rang(fyjfc)), apk(B) > apk(£dі*)) și rang(C) > rang(^(r"); prin urmare, rang(^jt) > max(rang(tj(jft)), rang(іd^)), rang(іad))) Dovada Din considerente de simetrie, este suficient să arătăm că r > rnk(A) > rnk(^( A) ) Deoarece matricea A are dimensiunea mxr, evident că nu poate avea un rang mai mare decât r ) matricea (ic^a) )) este egal cu AQ, unde Q este o matrice r x ns de forma Qpj,k) - bpcy Dacă x este orice vector rând astfel încât xA = , atunci xAQ = Prin urmare, toate dependențele liniare din A apar și în AQ și rang(AQ) , ui din polinomul x(u)y(u) mod (u - ) = wo + w^u + wșu + W U , atunci problema va fi rezolvată, deoarece u (ar (u)y(u) mod (u - )) mod (u - u) = wqu + w±u + w u + W U , iar combinația dintre ( ) și ( ) va duce la x(u)y(u) \u d HoYo + (W! - G Uz)n + W U + W U + (wo - GoYo)u + X Uzi ( ) (Desigur, această formulă poate fi verificată direct ) Rămâne de rezolvat problema calculării a:(u)y(u) mod (u - ) (această mică problemă este interesantă în sine) Pentru o clipă, să presupunem că polinomul x(u) are gradul și nu Atunci coeficienții x(u)y(u) mod (u - ) sunt хоуо + ari uz + х у + хзУі, хоуі + хіу + агУз + а?зУ , xY + X Y + X y + x uz, xhos + ar y + x: yi + x y și tensorul corespunzător este egal cu / \ / \ / \ / \ / / / I I I I / I I■ > \ / \ / \ / \і o o o/ În general, când deg(a:) = deg(y) = n - , coeficienții a:(u)y(u) mod (un - ) se numesc convoluție ciclică (xq, xi, , xn -i) și (yo>Yi, • • • ,Yn-i) - k-lea coeficient u>k este o formă biliniară ^Xiyj, unde suma este preluată peste tot i și j cu i + j = k modulo n O convoluție ciclică de gradul poate fi obținută prin aplicarea regulii ( ) Primul pas este găsirea factorilor u - , adică (ul)(u+l)(u +l) Este posibil scrieți sub forma (u - )(u + ), apoi aplicați regula ( ) și folosiți din nou ( ) modulo (u - ) = (u - )(u + ) Cu toate acestea, este mai ușor să generalizezi teorema chineză a restului ( ) direct la mai mulți factori coprimi De exemplu, z(u)y(u) mod și (u) ? (u) z (u) = (ai(u) (u) s(u)(a:(u)?/(u) mod i(u)) + a (u) i(u) s(u)(;g(u)y (u) mod (u)) + a (u) i(u) (u)( :(u)y(u) mod (u))) mod (u)q (u) (u) , ( ) unde ai(u) (u) s(u) + a (u) i(u) s(u)+az(u) i(u) (u) = (Această relație poate fi poate fi interpretat și în alt mod, observând că reprezentarea ca rapoarte parțiale u)/ (u) ) Din ( ) obținem x(u)y(u) mod (u - ) - (|(u + u +u+ ) :( )y( ) - |(u -u +u- )x(- ) y(- ) - |(u - )(;r(u)y(u) mod (u + ))) mod (u - ) ( ) Rămâne să calculăm x(u)y(u) mod (u + ) și să trecem la regula ( ) Mai întâi transformăm x(u) și y(u) mod (u + l) și obținem Ui -uz)i Apoi, conform regulii ( ), calculăm Ar(u)Y(u) = Zo + Ziu + Z u și, transformând-o modulo (u + ), obținem (Zo - Z ) + Ziu Calcularea X(u)Y(u) este ușoară: puteți folosi regula ( ) cu p(u) = u(u + ) și obțineți Zo = Xoyo, Zj = XoYo-(Ao-Xi)(Yo-Yi) + XiYi, Z = XiYi (Astfel am redescoperit trucul -( ) într-un mod mai sistematic ) Combinând totul împreună, obținem următoarea implementare a (A, B, C) gradul de convoluție ciclică: О О н І I О ' / \ О О О О H I î ' О / ( ) Aici înseamnă - și înseamnă - Tensorul pentru convoluția ciclică de gradul n satisface egalitatea ( ) indicele sunt considerați modulo n, deoarece tijk = dacă și numai dacă r + j = k modulo n, prin urmare, dacă (ssh), ( >z), (cm) este o implementare a convoluției ciclice, adică (c*) /), ( ->,z), (a,/); în special, se poate reprezenta ( ) prin transformarea ( ) în О / X ' / \ О О I Î H Î O V / O \ О О О О хі I О / ( ) Acum toate valorile scalare complexe se află în matricea A Acest lucru este important în scopuri practice, deoarece este adesea necesar să se calculeze convoluția pentru mai multe valori ale lui yo, y, y , y , dar cu un set fix de xq, Xi, x , X În așa situație, aritmetica pentru xj poate fi efectuată pentru toate valorile simultan și nu este nevoie să o recalculăm Astfel, ( ) conduce la următoarea schemă de calcul a convoluției ciclice wq, u, W , w , unde xo, xi, x , x sunt cunoscute dinainte: " = / + / , " = / + Uz, " = " + " , " = " - , z=Uo~U , v=y -y ," = " -" ; mi \u d + Xi + x + Xs) ■ S , m \u d | (x - xl + x - x ) ■ s , m \u d I (xo + Xi-x -Xs) - s , mp \u d | (-x + x + x -x ) -s , t \u d | (x -x ) • st, tl \ u d TP + t , t = TP + , ІЗ = PT- ~ t , t = t - PT- , WQ \u d tl + t , Wi-ts + ti, W - ti ~ t , Wz \u d Іz-I - ( ) Există înmulțiri și adunări, deși definiția convoluției ciclice include înmulțiri și adunări Ulterior se va dovedi că sunt necesare înmulțiri Să ne întoarcem la problema noastră inițială de înmulțire din ( ) Folosind ( ), obținem realizarea \ О О I / \ I О ] I О I I I/ / О О О О О I О О O I O I О \ o o o o o/ ( ) Această schemă folosește un lanț mai mult decât numărul minim de înmulțiri dintr-un lanț, dar necesită mult mai puține înmulțiri ale parametrilor decât ( ) Desigur, acest lucru este permis, deoarece circuitul este încă destul de complicat: dacă scopul nostru este să calculăm pur și simplu coeficienții zq, zi, , z ai produsului a două polinoame date (xo + x u + x u ) (y + yy + uzi + y u ) ca sarcină unică, cel mai bine este să pariați că metoda evidentă cu -înmulțire- -adunare poate fi utilizată dacă, să zicem, x* și yi nu sunt matrici O altă schemă moderat atractivă, care necesită înmulțiri și adunări, este dată în ex , (b) Rețineți că dacă x*, sunt fixe atunci când y sunt schimbate, atunci ( ) efectuează calcule cu înmulțiri și adunări Deși chiar și acest circuit nu este deosebit de util așa cum este construit, derivarea noastră ilustrează o tehnică importantă care este utilă într-o varietate de situații De exemplu, Winograd a folosit această abordare pentru a calcula transformata Fourier cu înmulțiri semnificativ mai puține decât este necesar pentru algoritmul de transformare Fourier rapidă (vezi exercițiul ) Încheiem această secțiune găsind rangul exact al tensorului de dimensiunea n x n x n, care corespunde înmulțirii a două polinoame modulo a treia: zo + ziU + • • ■ + zn-iun = (x + x u + • • • + x" iun )( /o + /iu +••• + /n iizn ) modp(u) ( ) Aici p(u) înseamnă orice polinom normalizat dat de gradul n; în special, p(u) poate fi un - , atunci un rezultat al studiului nostru va fi aflarea rangului tensorului corespunzator circumvolutiei ciclice de grad n Va fi convenabil sa scriem p(u) sub forma p(u) \u d un -rp-hyp - P W - ro- ( ) Astfel, un = po + piu + + Pn- u"~ (modulo p(u)) Elementul tensorului tijk este egal cu coeficientul vr în u+ modp(u) și este egal cu elementul în rândul i și coloana k a matricei PJ, unde ■ > R - ( ) \Po Pi P • ■ Pn-J se numește matricea însoțitoare p(u) (Indicii i, j, k în situația noastră variază de la la n - , și nu de la la n ) Tensorul este convenabil pentru transpunere dacă TV]k = tikj sunt straturi parțiale (Ty*) pentru k = , , , , n - sunt pur și simplu date de matrici I P P Rp~k ( ) Primele rânduri ale matricelor din ( ) sunt, respectiv, vectorii unitari ( , , , , ), ( , , , , ), ( , , , , ), ( , , , ,!); deci liniară combinația ѵk Pk va fi o matrice zero dacă și numai dacă toți coeficienții ѵk sunt egali cu zero Mai mult, majoritatea acestor combinații liniare sunt de fapt matrici nedegenerate, pentru care n - (sho," , • • • ,w" i) ^vkPk = ( , , , ) L== dacă și numai dacă v(u)w(u) = (modulo p(n)), unde-r(u) = "o+i'iwH (-""-іu"- hw(u) = wq+^iu-I -Fwn iun Astfel, vkPk este o matrice nesingulară dacă și numai dacă polinomul ѵ(u) este un multiplu al unui factor p(u) Acum suntem gata să dovedim rezultatul dorit Teorema W (Sh Winograd, ) Fie p(u) un polinom normalizat de grad n și fie factorizarea lui totală într-un câmp infinit dat p(u) = pi(u)ei pq(u)e" ( ) Atunci rangul tensorului ( ) corespunzător formelor biliniare ( ) este egal cu n - q peste acest câmp Dovada Formele biliniare pot fi calculate numai cu înmulțiri înlănțuite c n - q folosind regulile ( )-( ) în stilul adecvat Astfel, este necesar doar să demonstrăm că rangul r > n - q Faptul a fost stabilit peste acel rang(T(y)fc) = n; prin urmare, după Lema T, orice (n x r)-realizare {A, B, C) a tensorului (TDk) are rang(C) = n ("hapk" în traducere înseamnă "rank "- Notă, traducere) Strategia noastră este să folosim din nou Lema T pentru a găsi un vector (r>o, n, , "ni) care are următoarele două proprietăți i) Vectorul (yo,vi, ,vn i)C are cel mult q + r - n coeficienți nenuli ii) Matricea v(P) = £"=o vkPk ■ Aceste proprietăți și Lema T demonstrează că q + r - n > n Prin urmare, identitatea arată cum se implementează un tensor v(P) de mărimea nxnx de rang n folosind înmulțiri q + r - n într-un lanț Pentru comoditate, putem presupune că primele n coloane ale matricei C sunt liniar independente Fie D o matrice n x n astfel încât primele n coloane ale DC sunt egale cu matricea de identitate Scopul nostru va fi atins dacă există o combinație liniară (o,gz, ,n i) de cel mult q rânduri din D astfel încât v(P) să nu fie degenerat; acest vector satisface condițiile (i) și (ii) Deoarece rândurile lui D sunt liniar independente, factorul ireductibil pg(u) nu poate împărți polinoamele corespunzătoare fiecărui rând Fie vectorul w - (w , W , ,wn-i), acoperit(w) înseamnă mulțimea tuturor A, astfel încât w(u) nu este un multiplu al pg(u) Se poate găsi o combinație liniară v și w v + aw a doi vectori astfel încât covegefi + aw) = acoperit(r) U acoperit(w) ( ) pentru unii o apartinand domeniului Semnificația acestui lucru este că dacă A este acoperit de v sau w, dar nu de ambele, atunci A este acoperit de v + aw pentru toate a diferite de zero; dacă A este acoperit atât de v, cât și de w, dar A nu este acoperit de v + aw, atunci A este acoperit de v + / w pentru toate P a Dacă verificăm q + valori diferite ale lui a, atunci cel puțin una va satisface ( ) În acest fel se poate construi sistematic o combinație liniară de cel mult q rânduri ale matricei D care acoperă tot A pentru ? (Găsiți limite superioare și inferioare bune atât pentru n-ul mic, cât și pentru cel mare ) [M ] Aflați inversul transformării Fourier discrete uzuale ( ) exprimând F(ti, ,tn) în termeni de valori /(si, ,sn) [Indicaţie Vezi ecuația -( ) ] ► [FM ] (Transformata Fourier rapidă ) Arătați asta folosind diagrama ( ) se poate calcula transformata Fourier discretă unidimensională f(s) = £ w = em/ P, Astfel, f(x ,Xl, ,Xn) = - (r) ) este un sim- funcția metrică a n + argumente, (a) Demonstrați că f(xo, ,xn) = /(n\b)/rі! Pentru unele Ѳ situate între min(a?o, • • ■, xn) și max(xo, , xn) dacă derivata a n-a f^(x) există și este finită [Indicaţie Dovediți identitatea f(xo,xi, ,xn)= [ dti f dt [ d£n/(n)(zo(l - h) + (r)i(ti -* ) Jo Jo Jo " Xn - l(tn- tn) ~ Xn(tn )) * Această formulă definește și f(xo,xi, ,xn) atunci când Xj nu sunt distincte ] (b) Dacă yj = f(xj), arătați că aj = f(x , ,xj) în Polinomul de interpolare al lui Newton ( ) [M ] Cum se pot calcula cu ușurință coeficienții U[n](a?) = uxn + • • -+io dacă valorile a?o, a?i, , xn-i, ao , ai, , an în polinomul de interpolare al lui Newton ( )? [M ] Să se arate că formula de interpolare ( ) se reduce la o expresie foarte simplă care implică coeficienți binomi când Xk = xo + kh pentru L p- i L p- i I (n-l)mod h\Z)-(Ln- - "b Gn - - " "b ' ' ' "b G>(n i) mod % Să presupunem că h(z) nu este identic zero a) Să se arate că p(z) are cel puțin n - rădăcini imaginare (adică rădăcini a căror parte reală este zero) și h(z) are cel puțin n - rădăcini imaginare [Indicaţie Luați în considerare de câte ori traiectoria f(z) ocolește originea pe măsură ce z se mișcă de-a lungul căii prezentate în fig , pentru o rază suficient de mare R ] b) Demonstrați că pătratele rădăcinilor p(z) = și /i(z) = sunt toate numere reale Orez Demonstrarea teoremei lui Yves ► [M J] Aflați valorile lui c și ak, Pk, îndeplinind condițiile teoremei E, pentru polinomul u(m) = (m + )(m + x + )(m + x + )(m + ) Alegeți aceste valori astfel încât / r = Dați două soluții diferite [M ] Când construcția din demonstrația teoremei M este aplicată unui lanț ineficient de polinoame Ai \u d ai + Ao, Ag \u d - Ao - Ao, Az \u d Ai + Ai, Ad \u d ar x Az, Az \u d Ao - Ao, Av \u d ao - Az, At \u d la x Av, Av \u d Ag x At, Hell \u d Ai x Hell, Aio \u d av - Hell, An \u d Az - Ayu, cum poate fi exprimat / i, / g, , / g în termeni de ai, , az? ► [M ] (a) Obţineţi un lanţ de polinoame corespunzător regulii lui Horner pentru calcularea polinoamelor de gradul m = (b) Folosind construcţia din demonstraţia teoremei A, exprimaţi "i, kz, k şi polinomul la capătul lanțului u(x) în termeni de /Zi, /Zg, /Zz, /Zd și x (c) Să se arate că mulțimea de polinoame de la sfârșitul lanțului obținut în (b), când toate / i, / r, / și / g iau independent toate valorile reale, nu conține unele elemente ale mulțimii obținute la capătul lanțului (a) [M ] Fie R mulțimea care include toate rândurile de dimensiune (n + ) de numere reale ( impar Demonstrați că un lanț de polinoame cu [n/ ] + pași de înmulțire nu poate calcula toate polinoamele de gradul n decât dacă are cel puțin n + pași de adunare-înmulțire [Indicaţie Vezi ex treizeci ] [M ] Fie Ao, Ai, , Ag un lanț de polinoame în care toți pașii de adunare și scădere sunt pași de parametri și printre care există cel puțin un parametru de înmulțire Să presupunem că acest circuit are m înmulțiri și k = r - m adunări și scăderi, și că evaluarea unui polinom de-a lungul unui lanț are gradul maxim n Demonstrați că toate polinoamele evaluate de-a lungul acestui lanț, ai căror coeficienți la xn nu sunt egali cu zero , poate fi calculată de-a lungul unui alt lanț care are un maxim de m înmulțiri, un maxim de k adunări și fără scăderi De asemenea, ultimul pas al noului lanț ar trebui să fie doar o multiplicare a parametrilor ► [M ] Arătați că orice lanț de polinoame care calculează un polinom de gradul al patrulea din forma generală folosind trei înmulțiri trebuie să aibă cel puțin cinci adunări și scăderi [Indicaţie Să presupunem că există doar patru adunări și scăderi și arată că ex , deci circuitul trebuie să fie de o formă particulară care nu reprezintă toate polinoamele de gradul al patrulea ] [M ] Continuând exercițiul anterior, arătați că orice lanț de polinoame care evaluează la un polinom obișnuit de gradul șapte și folosește doar patru înmulțiri trebuie să aibă cel puțin șapte adunări și scăderi [M J] (T S Motzkin) Arătați că "aproape toate" funcțiile raționale de forma (ipxp + ip- XP~ + • • ■ + U X + io)/(xp + Vp- XP~ + • • • + Vix + Vd) cu coeficienți din câmpul S pot fi calculate folosind schema Ots + /? /(t + c* + /?g/(t + • • • + Pp/{x + • • )) pentru aj corespunzătoare, D, din S (Această schemă de fracții continuă are n diviziuni și n adunări; prin "aproape toate" funcțiile raționale se înțelege toate funcțiile cu excepția celor ai căror coeficienți satisfac unele ecuații polinomiale netriviale ) Definiți ak și j pentru funcția rațională (x + m + )/(m + r + ) ► [НМ [ (V Ya Pan, ) Scopul acestui exercițiu este de a demonstra că regula lui Horner este într-adevăr optimă, dacă coeficientul nu este mai întâi adaptat Este necesar să se efectueze n înmulțiri și n adunări pentru a calcula ipxn + - ■ - + uix + id, dacă sunt date variabilele u, , u, id, x și constante arbitrare Luați în considerare șiruri de caractere ca înainte, dar astfel încât un, ■ ■ ■, ii, id, x să fie variabile De exemplu, putem spune că Xji - Uj, Xd - x Pentru a arăta că regula lui Horner este cea mai bună, este convenabil să se demonstreze o teoremă mai generală Fie A = (wu), n [Sugestie Arătați că din orice astfel de circuit este posibil să derivați un alt circuit care are mai puține înmulțiri în lanț și n este redus cu unu ] [M ] (T S Motskin, ) Să se arate că o schemă de formă u> = x(x + ai) + /?!, Wk = w* i(wi + ~fkX + ak) + kx + pk pentru înmulțiri are maxim t m + grade de libertate (b) Arătați că pentru toate n > există polinoame de gradul n ai căror coeficienți sunt zero sau unu care nu pot fi calculate prin orice lanț de polinoame cu înmulțiri mai mici de [^nj, dacă toți parametrii a trebuie să fie numere întregi, ( c) Să se arate că orice polinom de gradul n cu coeficienți întregi poate fi calculat folosind un algoritm cu numere întregi care efectuează maximum [\/n] înmulțiri dacă numărul de adunări efectuate este irelevant [ ] Explicați cum se calculează xn + • • • + x + efectuând (n + ) - înmulțiri și (n + ) adunări (nu împărțiri sau scăderi), unde Z(n ) este funcția discutată în Secțiunea ► [M ] Să se arate că orice polinom normalizat u(x) = xn + un-\xn~ -I-+ u poate fi calculat prin efectuarea de |n + O (log n) înmulțiri și m, j > n, k > s; altfel t "jk = Produsul lor direct = (t" jk) este tensorul de dimensiune mm'xnn'х ss' definit ca = tijkt'i fc) ► [HM \ Arătați că rangul unui tensor (tijk) de dimensiunea m x n x este același cu rangul său atunci când este scris ca o matrice (tiji) de dimensiunea m x n, corespunzătoare definiției tradiționale a rangului unei matrice ca numărul maxim de linii liniar independente [NM \ (Sh Vinograd ) Fie (tijk) un tensor de dimensiunea m x n x m corespunzător înmulțirii unei matrice de dimensiunea m x n cu un vector coloană de dimensiunea n x Demonstrați că rangul tensorului (tijk) este egal cu m [M ] (Sh Vinograd ) Vino cu un algoritm pentru convoluția ciclică de gradul care folosește înmulțiri și adunări, fără a include operațiile pe x În mod similar, găsiți un algoritm pentru puteri de folosind înmulțiri și adunări (Vezi relația ( ), care ne permite să rezolvăm o problemă similară pentru gradul ) [M ] (Sh Vinograd ) Fie n = rin", unde n! ± n" Să fie date circuite normale pentru convoluții ciclice de gradul n' și n", folosind, respectiv, înmulțiri în lanț (m',m"), înmulțiri ale parametrilor (p, p") și adunări (a', a") construiți o schemă normală pentru convoluția circulară de gradul n folosind înmulțiri de lanț m't", înmulțiri ale parametrilor p'n" + m'p" și adunări a'n" + m!a" [HMJ ] (Sh Winograd ) Fie w acea rădăcină complexă a unității Luați în considerare transformata Fourier discretă unidimensională f(s) = F(t)wst, pentru oiankd(tijk), unde rangd este definit în exercițiu Demonstrați că tensorul (JJ) J) are rangul , dar o față de rangul este peste fiecare câmp [IMZO] Fie T(m, n, s) tensorul de multiplicare a matricei, ca în Ex , și fie M(N) rangul lui T(N,N,N) a) Să se arate că T(m, n, s) T(M, N, S) = T(mM, nN, sS) b) Arătați că rankd(T(mN, nN, sN)) + uXij)(yj + uYtj)(Z + u Zij) - (хі + • • • + xm)(yi -Ih yn)Z, il j = l Când ! X,j = E;=i Uii = [YAL ] Utilizați rezultatul exercițiului pentru a rafina fețele asimptotice din exercițiu a) Demonstrați că există o limită b) Demonstrați inegalitatea (mns)^^ g) Generalizați (c) în cazul în care (A, B, C) este o realizare a lui t, numai în sens slab de ex h) Din (dl) rezultă că hapk(T( )fG( , , )) : \u d ((a + -p) VITup i + ( a + - Ti) V Wn -I h noVnWo) /p ( ) Din relația ( ) se poate obține un algoritm interactiv simplu pentru determinarea succesivă a Um, W , , folosind aproximativ n înmulțiri pentru a calcula al n-lea coeficient Observăm un caz special când a = - ; ( ) devine un caz special al lui ( ) pentru U(z) = Vq = Metode similare pot fi folosite pentru a forma /(V(z)), când / este orice funcție care satisface o ecuație diferențială simplă (vezi, de exemplu, exercițiul ) Pentru a rezolva ecuațiile diferențiale, se folosește adesea o "metodă a seriei de puteri" relativ directă Este dat în aproape toate manualele despre ecuații diferențiale Inversarea rândurilor Poate cea mai interesantă transformare a seriei de putere este inversarea în serie Această transformare ne permite să rezolvăm ecuația z - t + Vgі + + V t + • • • (Yu) cu privire la t, i e obțineți coeficienții seriei de putere t = z + W z + W z + W z + - (unsprezece) Sunt cunoscute modalități deosebit de interesante de a efectua o astfel de conversie Putem spune că metoda "clasică" se bazează pe remarcabila formulă de inversare Lagrange [Memorii Acad Royade des Sciences et Belles-Lettres de Berlin ( ), - ], stabilind că Wn = - [t"- ] ( + V t + V t + •••)-" ( ) n De exemplu, avem ( - t)~ = (e) + ((r))t + ((r))t + • • •, atunci al cincilea coeficient, W , al inversiei z = t - t este ((r)) / = Acest lucru este verificat folosind formula de enumerare a arborelui binar prezentată în secțiunea În relaţia ( ), care are o demonstraţie algoritmică simplă (vezi exerciţiul ), se arată că seria ( ) poate fi inversată dacă puterile negative ( + V t + V t + ■ • ■) n se calculează secvenţial pentru n = , , , O aplicare directă a acestei idei ar trebui să conducă la un algoritm de inversare interactiv care utilizează aproximativ n/ înmulțiri pentru a calcula N coeficienți, dar relația ( ) face posibilă lucrarea numai cu primii n coeficienți (I+VD+ V ^H - ) n obținuți printr-un algoritm interactiv care necesită doar aproximativ n/ înmulțiri Algoritmul L (Inversarea unei serii de puteri prin metoda Lagrange) Acest algoritm interactiv (Fig ) introduce valoarea lui Vn din ( ) și scoate valoarea lui Wn din ( ) pentru n = , , , , N (Nu este nevoie să cunoașteți numărul exact N în avans; algoritmul poate fi terminat în funcție de orice criteriu ) L [Inițializare ] Atribuiți n N, algoritmul se termină, altfel introduceți următorul coeficient Vp- L [Diviziune ] Atribuiți Uk N, algoritmul se termină, în caz contrar el stochează următoarele două valori de intrare (și anume, Un și Vp) în Tsh și Vp T [Înmulțire ] Atribuie Ttp ■ p- + T Tt- t- N + T t-t+ Tt- ,t- Și Tw și, când m - , se obține Un = Tn + V T P + • • • + VnTn conform ( ) și ( ) ) Reveniți la pasul T | Relația ( ) explică mecanismul acestui algoritm propus de Henry K Thacher (Jr ) (Hengu C Thacher, Jr ) [CACM ( ), - ] Timpul de calcul al algoritmului este în esență același cu cel al algoritmului L, dar necesită o cantitate mult mai mare de memorie pentru a stoca datele Un exemplu de funcționare a algoritmului este dat în ex O altă abordare a inversării seriei de putere este propusă de R P Brent și H T Kung, JACM ( ), - Se bazează pe faptul că procedurile iterative standard care sunt utilizate pentru a găsi rădăcinile ecuațiilor cu numere reale pot fi aplicate și ecuațiilor pentru serii de puteri În special, se poate lua în considerare metoda lui Newton pentru calculul aproximativ al unui număr real t astfel încât /(t) = , iar o funcție dată f se comportă bine într-o vecinătate a lui t: dacă x este o bună aproximare a lui t, atunci φ (x) = x - /(a;)//'(x) ar fi o aproximare și mai bună Scriind x = t + e, obținem /(a;) = /(t) + e/'(t) + O(c ), /'(a;) = f'(t) + O(e); deci φ(x) = t + e - ( + e/'(i) + K, algoritmul este terminat; în caz contrar, introduceți valorile Un și Vn pentru N oo (Pe de altă parte, constanta de proporționalitate este astfel încât N trebuie să fie cu adevărat mare înainte ca algoritmii L și T să nu mai fie considerați metode "rapide" ) Referință istorică JN Bramhall și MA Chapple au publicat pentru prima dată o metodă de inversare a seriei de putere care necesită operații O(n) în CACM ( ), - , Acesta este în esență un algoritm de sine stătător, echivalent cu metoda dată în Ex , cu același timp de numărare ca și algoritmii L și T Iterație de rând Pentru a studia comportamentul procesului iterativ xn În multe cazuri, notația f^(x) are sens și pentru numerele întregi negative n (r))), iar dacă funcțiile inverse sunt definite în mod unic, atunci ( ) este valabilă pentru toate numerele întregi tipuri Inversarea în serie este în esență operația de găsire a seriei de putere inversă f^(x) De exemplu, relațiile ( ) și ( ) stabilesc că z - V(U (r)) și t = U (V( )i; astfel, W = Să presupunem că ni se dau două serii de puteri, V(z) = z + V z N- ■ • • și W(z) = z + W z + ■ ■ ■, astfel încât W = Fie u orice constantă diferită de zero Luați în considerare funcția U(z) = W(uV(z}) ( ) Este ușor de observat că J ( (z)) = Hr(u I/'(z)) și în general U[n](z) = VV(unV(z)) ( ) pentru tot întregul n Prin urmare, avem o expresie simplă pentru a n-a iterație care poate fi calculată cu aproximativ aceleași costuri de muncă pentru toate n În plus, se poate folosi chiar ( ) pentru a determina valorile non-întregi ale lui n De exemplu, "semi-iterația" J/I / ! este o astfel de funcție încât E/I / ! (d)) = U(z) (Există două astfel de funcții J / ! obținute în rezultatul utilizării Dy u - Qi ca valoare a u / în ( ) ) Am obținut relații simple în ( ), care, pornind de la V și u, determină U Dar, în practică, se folosește de obicei o altă metodă: pornind de la o funcție dată U, găsiți Vii astfel încât ( ) să fie satisfăcută, adică astfel încât V([Г(г)) = uV(z) ( ) O astfel de funcție V se numește funcția Schröder U deoarece a fost introdusă de Ernst Schröder (Math Annaten ( ), - ) Luați în considerare problema găsirii funcției Schroeder V(z) = z + V Z + • • • o serie de puteri dată U = Uiz + U Z + • • • Evident, u = Ui dacă ( ) este valabil Înlocuind u = Ui în ( ) și adunând coeficienții la z, ajungem la o secvență de ecuații care începe cu u?v + u = iad u?v + gsdad + u = iad uțvt + zi i v + gadv + iad + u = urv și așa mai departe Este clar că nu există soluție când Ui = (cu excepția cazului banal când U = U = • • ■ = ), dar există o soluție unică dacă Ui nu este rădăcină a unității Putem presupune că se va întâmpla ceva amuzant atunci când U(tm) = , deoarece este clar din ( ) că nl(z) = z dacă funcția Schroeder există în acest caz Să presupunem pentru un moment că Ui nu este egal cu zero și nu este egal cu rădăcina lui unu Atunci funcția Schroeder există și apare următoarea întrebare: "Cum să o calculezi fără a depune prea mult efort?" Următoarea procedură a fost propusă de R P Brent și J F Traub Ecuația ( ) conduce la o subproblemă similară, dar de o formă mai complexă Astfel, am pus o problemă mai generală, a cărei subsarcină are aceeași formă Să încercăm să găsim V(z) = Vq + Vz + • • • + Vn !Zn , astfel încât V(ad) = W(z) V(z) + S(z) + O(zn), ( ) unde sunt date U(z), W(z), S(z) și n, n este o putere a două și £ ( ) = Pentru n = , se stabilește pur și simplu Vq = S( )/(l este un IDO) ) cu Vq = dacă ( ) = și W'( )= Mai mult, este posibil să trecem de la n la n: mai întâi găsim R(z) astfel încât V(£ (z)) = W(z)V(z) + S(z) - znR(z) + O(z n), ( ) apoi calculează W(z) = W(z) (z/U(z))n + O(zn), S(z) = R(z) (z/U(z))n + O(zn) ( ) și găsiți V(z) = Vn + Vn+iz + h V n izn astfel încât V(U(z)} = W(z)V(z) + S'(z) + O(zn) ( ) Prin urmare, funcția V*(z) = V(z) + znV(z) satisface V* (U(z)) = W(z)V*(z) + S(z) + O(z n), care este ceea ce s-a cerut Timpul de rulare al acestei proceduri T(n) satisface relația T( n) = T(n) + C(n), ( ) unde ( (ті) este timpul de calcul al R(z), TT(z) și S(z) Funcția ( ( ) ia timpul principal în calcularea V(U(z)) modulo z n, ordinul de creștere este С( n) este probabil mai mare decât n +e, prin urmare soluția T(n) a relației de recurență ( ) va fi de ordinul C(n) De exemplu, dacă C(n) = cn , obținem dacă ( (ti) este egal cu O(n log i) // , cu ajutorul compoziției "rapide" obținem T(n) - O( llog l) / Procedura nu funcționează când AND'( ) = și ( ) / , deci este necesar să se investigheze când se întâmplă acest lucru Este ușor de demonstrat prin inducție pe τi că soluția ( ) conform metodei Brent-Traub presupune luarea în considerare a exact τi subprobleme în care coeficienții V(z) ai părții drepte a ecuației iau valorile corespunzătoare W^ (z)(z/[ (z)) + O(zn) pentru și Uk / Atunci putem arăta că există singura serie de puteri de forma V(z) = zk + V*+іzk+ + Vk+ Zk+ + • • • care satisface ( ) Prin urmare, dacă este dată o astfel de funcție V(z) și dacă sunt date k > și Uk, atunci există o serie unică de forma U(z) = z + UkZk -I- Uk+izk+ + • • • satisfăcător ( ) Iterația necesară U^(z) este singura serie de puteri P(z) satisfăcătoare V(P(z))=P'(z)V(z), ( ) unde P(z) = z + nUk zk + ■ ■ ■ Ambele funcții, V(z) și P(z), pot fi găsite folosind algoritmi adecvați (vezi exercițiul ) Dacă Ui este o rădăcină k-il a unității, alta decât , atunci aceeași metodă poate fi aplicată funcției J/W(z) = z + ■ • • și U^(z) poate fi găsită din J (z) prin producerea Z (fc) operații de compunere (vezi secțiunea ) Se poate lua în considerare și cazul când Ui - : dacă U(z) = Uk zk + Uk+izk+ -, unde k > și Uk / , atunci ideea este este de a găsi o soluție la ecuația V(J (z)) = UkV(z)k Apoi £/W(z) = (Cr£(fcn )/(fc )] V(z)fcn) ( ) Și în sfârșit, dacă U(z) = Uo + Uiz + • • •, unde Uo / , fie a un "punct fix" astfel încât U(a) = a, și fie U(z) = U(a + z) - a = zU'(a) + z U"(a)/ ! + • • ■ ( ) Atunci [An (z) = U^(z - a) + a Detalii pot fi găsite în Brent și Traub, SICOMP ( ), - Funcția V din ( ) este considerată în esență în cartea lui M Kuczma, Funcționale Equations in a Single Variable (Varșovia: PWN-Polish Scientific, ), Lema și, bineînțeles, de E Jabotinsky pe câteva cu ani mai devreme (vezi exercițiul ) Funcții algebrice Coeficienții fiecărei serii de puteri W(z) care satisfac o ecuație generală de forma An(z)W(z)n + • • • + ADg) W(z) + A (z) = , ( ) unde fiecare Ai(z) este un polinom poate fi calculat eficient prin metoda propusă de H T Kung și JF Traub, JACM ( ), - Vezi, de asemenea, DV Chudnovsky şi GV Chudnovsky, J Complexity ( ), - , ( ), - EXERCIȚII [Wfl] Această secțiune explică cum se împarte U(z) la V(z) când Vo este Cum se împarte când Vo = ? [ ] Când coeficienții C (z) și V(z) sunt numere întregi și Vo , găsiți relația de recurență pentru numerele întregi V n+ PVn, unde Wn este definit în ( ) Cum poate fi folosit pentru a împărți serii de puteri? [M ] Va fi corect rezultatul dat în formula ( ) când a = și când a = ? ► [HM ] Arătați că o simplă modificare a lui ( ) poate fi folosită pentru a calcula e'^ ) când Vo = și In V(z) când Vo = [M ] Ce se întâmplă dacă seria de puteri este inversată de două ori, adică dacă valorile de ieșire ale algoritmului L sau T sunt inversate din nou? ► [M ] (H T Kung (N T Kung) ) Aplicați metoda lui Newton pentru a calcula W(z) = /V(z) când V( ) , definind rădăcina ca serie de puteri a ecuației f( x) = , unde f(x) = x~ -V(z) [M ] Folosind formula de inversare Lagrange ( ), găsiți o expresie simplă pentru coeficientul Wn în inversarea z - t - tm ► [M ] Pentru W(z) = Wrz + W z + W z + ■ ■ ■ = Git + G t + G t + ■ ■ ■ = G(t), unde z = Vit + V t + V t -I-și Vi , Lagrange a demonstrat că Wn = -Ч G'(t)/(Vi + V t + V t + ■ • • )n n (Relația ( ) este un caz special al celui precedent, când Gi = C = , G = G = ■ ■ ■ = ) Extindeți algoritmul L în așa fel încât pentru această situație mai generală să calculeze coeficienții Wi, W , fără o creștere semnificativă a timpului de rulare a algoritmului [ ] Folosind algoritmul T, găsiți valorile lui Tmn ca primii cinci factori de inversare z = t - t [M ] Având în vedere y - xa + aixa+x + a, Xa+ + ■■■, a Arată cum se calculează coeficienții în expansiunea lui x = + t > j/ /" + b / /" + • • • • ► [M ] (Alcătuirea seriei de puteri ) Let U(z) = UO + U!Z + U Z + ■■■ și V(z) = Viz+ V z + V z + ■ ■ ■ Proiectați un algoritm care calculează primii N coeficienți ai lui U(V(z)) [M ] Aflați legătura dintre împărțirea polinoamelor și împărțirea serii de puteri Polinoamele u(x) și ѵ(x) de tip grad sunt date, respectiv, peste câmp Arătați cum să găsiți polinoamele q(x) și r(x) astfel încât u(x) = q(x)v(x) + r(x) și deg(r) i(z)/w (z) + O(z ) , unde u>i(z) și w (z) sunt polinoame cu deg(wi) + deg(w ) i(z)/w (z) + O(zN) cu deg(wi) + deg(w ) și k > ► [M ] Dată o serie de puteri V(z) = Viz + V z + V z + • • ■ Să definim puterea matricea V ca tabel infinit de coeficienți vnk = [zn]V(z)k; al-lea poweroid (poweroid) V este definit ca Vp(x) = vno + vpix -I- + Vnnxn Demonstrați că degreoid satisface legea generală a circumvoluției Vn(x + y) = ^Pk)ѵk(x)Vn-k(y) k (De exemplu, când V(z) = z, obținem Vn(x) = xn, iar aceasta este teorema binomială Când V(z) = n( /( - z)), conform -( ) obținem ѵпк = [Д- Prin urmare, degreoid l'n(z) este egal cu xn, iar identitatea coincide cu rezultatul dovedit în exercițiu - Când V(z) = ez - , obținem Vn(x) = {£}x* și această formulă este echivalentă cu egalitatea (l + m\( n ug (n\ ( k ( n - k ) \ t /U + mJ \ k) t IJ t t g k pe care nu le aveam înainte Alte tabele triunghiulare de coeficienți care apar în matematica combinatorie și analiza algoritmilor se dovedesc, de asemenea, a fi matrici de putere ale serii de puteri ) [HM ] Continuând cu ex , dovediți că și poweroid-ul satisface ecuația xVn(x + y) = (x + k [Indicaţie Se consideră derivata exV^z\] [M ] Continuând cu ex , exprimați toate numerele vnk în termeni de numere ѵp - ѵpi - n! Vn din prima coloană și găsiți o formulă recursivă simplă care vă va permite să obțineți toate coloanele din secvența Hz, ѵz, ■ ■ ■ • În special, arătați că dacă toate vn sunt numere întregi, atunci toate vnk sunt și numere întregi [HM ] Continuarea exercițiului , să presupunem că W(z) = U(V(z)) și Uo - Demonstrați că matricea de putere W este egală cu produsul matricelor de putere V și U: wnk = ȘL, VnjUjk- ► [НМ ] Continuând exercițiul anterior, să presupunem că Vi și să fie W(z) = -V^~ \-z) Scopul acestui exercițiu este de a arăta că matricele de putere V și W sunt "duale" între ele; de exemplu, când V(z) = n( /( - r)), atunci = - e~z, W(z) = ez - , iar matricele de putere corespunzătoare sunt binecunoscutele triunghiuri Stirling vnk - [£] și = {£} a) Demonstrați că formula de inversare -( ) pentru numerele Stirling este de obicei valabilă într-un caz mai general: VnkU!km(-U)n~k = U? WnfcVfcm(-l)n fc = tp kk b) Din relația v^nk) = n-[zk] (V(z)/z)n~k pentru k fix rezultă că vn(n-fc)/V\ este un polinom în n de grad , Z > , * / , VJ / și Z (V(z)) = V(Z (z)), demonstrați că k = Z și V(z) = Z ["J(z ) pentru a = Vk/Uk [M ] Arătați că dacă U(z) = Uo + Utz + U Z ■■■ și V(z) = ViZ + V Z + ste- serie de spumă, a căror toți coeficienții sunt fie , fie , se pot obține primii N coeficienți Z (V(z)) modulo în trepte O(AȚ +t) pentru orice e > [M ] (D Zeilberger) Găsiți o formulă recursivă similară cu ( ) pentru a calcula coeficienții W(z) = V(z)V(qz) V(qm~ z) pentru q um dat iar coeficienţii V(z) = + Viz + V Z + • • • Se presupune că q nu este egal cu rădăcina unității [НМ ] O serie Dirichlet este o sumă de forma V(z) = Vi/ r+V / r+V / r- -; muncă U(z)V(z) a două astfel de serii este seria Dirichlet W(z) pentru care Wn = ^UdVn/d d\n Seriile obișnuite de putere sunt un caz special al seriei Dirichlet, deoarece Vo + Viz + V?z + V Z + • • • = Vo/la + Vi/ S + VDV + V / + • • • când z = ~ De fapt, seriile Dirichlet sunt echivalente cu seriile de putere de forma V(zi,Z , ) cu un set arbitrar de variabile, unde zk = pk și pk este al k-lea număr prim Găsiți o relație de recurență care poate fi folosită pentru a generaliza ( ) și formula din exercițiu , presupunând că seria Dirichlet V(r) este dată și că este necesar să se calculeze (a) W(z) = V(z)a când Vi - ; (b) W(z) = expV(z) când Vi = ; (c) W(z) = InV(z) când Vi = [Sugestie Fie t(n) numărul total de factori primi n, inclusiv multipli, și fie S^^Vn/n - ■ Să se arate că operația o t Ok/( k)! și așa mai departe În special, cea mai mică cifră va fi par cu probabilitatea e mcoshm = | + |e~ m și nu este niciodată egal cu | (deși eroarea este neglijabilă când m este mare) Cu toate acestea, este perfect legal să luăm zece observații (atunci, h)) (f) OK; potrivit dacă timpul scurs de când cifra a fost selectată este aleatoriu Cu toate acestea, sunt posibile distorsiuni în cazurile limită (f, g) Nu În general, oamenii sunt mai predispuși să selecteze anumite numere (vezi ) (h) OK; cu această distribuție a numerelor, probabilitatea ca un anumit număr să fie atribuit calului câștigător este egală cu A Numărul de astfel de secvențe este egal cu coeficientul polinomial ! / ( !) ; astfel, probabilitatea dorită este egală cu acest număr împărțit la , numărul tuturor secvențelor conținând un milion de cifre Folosind formula Stirling, aflăm că probabilitatea este apropiată de /( tg IO h/ tg) la , x ~ Aproximativ vorbind, acest lucru se întâmplă într-un caz din x IO (a) Ajungem la pasul K numai după pasul K sau K și, în orice caz, este ușor de observat că X nu poate fi egal cu zero Dacă X ar putea lua valoarea "zero" la acest pas, atunci algoritmul nu s-ar termina niciodată (programul s-ar bucla) (b) Dacă X este setat la , atunci calculele sunt similare cu cele ale pașilor din Tabelul Diferența este că intrăm în starea K Y + = de ori în loc de Y + = de ori; deci La fel - -e - -> -e Există doar numere din zece cifre IO ; unele valori ale lui X trebuie repetate la primii pași IO + Și de îndată ce orice valoare este repetată, secvența își va repeta comportamentul anterior (va apărea periodicitatea) (a) Folosind aceleași argumente ca în cazul precedent, este ușor să arăți că una dintre valori trebuie să se repete în succesiune Fie prima dată când o astfel de repetiție să aibă loc la pasul p + A, unde Xfl + x - (Această condiție determină p și A ) Se obține n avem Xr = Xn dacă și numai dacă r - n este un multiplu al lui A și n > p Prin urmare, X n = Xn dacă și numai dacă n este un multiplu al lui A și n > p Rezultatele așteptate urmează imediat [Cometariu Aceasta este, în esență, o dovadă a binecunoscutei afirmații matematice: "Puterile unui element dintr-un semigrup finit includ un singur element idempotent: luăm Xi = a, f(x) = ax "] (c) Odată găsit n, se generează Xi și Xn+, pentru i > , până când se găsește primul Xi = Xn+i; atunci p = r Dacă niciuna dintre valorile lui Xn + i pentru astfel încât n - (t(n) - ) este un multiplu al lui A și t(n) - > p este egal cu n = poate fi comparată cu cel mai mic n > , pentru care X? n \u d Xn, adică A ([p / A] + este minimul dintre acele j pentru care inegalitatea e (p + j) > [lg A] - Folosind această metodă, niciunul dintre valorile lui X este n Apare de mai mult de două ori și cel mult max(l, ^lgA' ) vor apărea mai multe valori aleatoare ale numerelor [MIT AI Laboratory Method ( februarie ), Hack ] R Sedgewick, T G Szymanski și A C Yao (AC Yao) au analizat un algoritm mai complex bazat pe utilizarea parametrilor m > și q > : tabelele auxiliare de dimensiune m includ Xo, Xt, , Xt la timpul când se calculează Xn, unde b = ^lgn/,m' și q = [m/b] - Dacă mt mod gb mmin/Dmn + g + nu este satisfăcută Deci, această metodă "online" poate fi folosită pentru a garanta numere aleatoare diferite, astfel încât doar + O(m~ / ) evaluări ale funcției sunt necesare pentru a obține un număr [SICOMP ( ), - ] (a,b) , , [ valori inițiale]; , , [ ]; , , [ ]; , , [ ]; , , , , [ ] (c) sau ; ambele numere dau seturi care conțin valori diferite și anume: sau , , , , , , , , , , , , , , Din momentul X , atunci X /bn o an ГІ*=i( - k/m), atunci /(ao, ai, ) = ao + /(ai, ar, ) - /(ai, ar, ■)/• n, aplicăm această identitate cu an = (ti + )/ ) Prin urmare, valoarea medie lui A (și datorită simetriei lui P(p, A) precum și p + ) este aproximativ egal cu Valoarea medie a lui p + A este exact Q(m), care este aproximativ egală cu q/mm/ - | [Derivațiile alternative și alte rezultate, inclusiv valorile asimptotice ale momentelor, sunt date în A Rapoport, Bull Matematică Biophysics ( ), - și B Harris, AnnaJs Math stat ( ), - ; vezi, de asemenea, Sobol I M , Theory of Probability and Its Applications ( ), - Sobol discută asimptoticele lungimii perioadei pentru o secvență mai generală Xn-s = f(Xn) dacă n Opomodulut, Xn+i = q(Xn') dacă n = Opomodul, când ambele / și q sunt aleatoare ] [Pardom P (Paul Purdom) și Williams J (John Williams), Trad amer Matematică soc ( ), - ] Fie Tmn numărul de funcții care au n cicluri de lungime unitară și nu mai sunt cicluri Apoi Ttp t - - t - p t (Acesta este același cu t - ti) în ex - ) Se obține orice astfel de funcție din aceeași funcție ca urmare a permutării tі cicluri de unitate de lungime Prin urmare n > T(tm)n Ti! = oraș Fie Ppc numărul de permutări a n elemente al căror ciclu cel mai lung are lungimea k Atunci numărul de funcții cu ciclul cel mai lung de lungime k este egal cu Sn>i TmnPnk Pentru a obține valoarea medie a lui k, calculăm suma următoare din ex - este egal cu £p> Tmp p\{cn + |c + O(m- )), unde c " Rezumând, obținem că valoarea medie este egală cu cQ(m) + |c + O(m /' ) (Această expresie este, de fapt, nu mai mult decât valoarea medie a lui k atunci când Xo este ales la întâmplare Valoarea medie a lui max/i este asimptotic egală cu Q(m)ln și valoarea medie a lui max(/r + A) este asimptotic egală cu , Q(m); vezi Flajolet şi Odlyzko, Note de curs în Comp sci ( ), - ) Fie cr(m) numărul de funcții care au exact r cicluri finale distincte Din relația recursivă sdmn) = (mn - )! - Ș fc> (Ț)(- )k(mp - k)ksi(mp - k), care se poate obține prin numărarea numărului de funcții a căror imagine conține nu mai mult de mn - k elemente, rezultă că u( mp ) = (Vezi exercițiul - ) Altele un mod de obținere a u(tn), care este poate mai elegant și mai indicativ, este dat în ex - Valoarea lui cg(tp) poate fi determinată în același mod ca în exercițiu : - G" tpp - TP L G J G t - i - ! Lrj t G tp - tp - ! Ig] tp tp Acum puteți calcula valoarea medie necesară (vezi exercițiul ): E T (n + HgT?-± \ T + ZN tp - t - t t t- It-It- + d -F o -k t t t Ultima formulă a fost obținută într-un mod ușor diferit de M D Kruskal [vezi Martin D Kruskal, AMM ( ), ] Folosind reprezentarea integrală a dovedit relaţia asimptotică Pentru alte rezultate, precum și referințe la literatură, vezi John Riordan, Annals Math stat ( ), - Probabilitatea ca /(a?) x pentru tot x să fie (mn - )m/mm, care este aproximativ egală cu /e Existența unei valori care se repetă singur într-un algoritm ca al lui K nu este așadar "colosală"; probabilitatea sa este - /e " Singurul lucru "colosal" a fost că autorul a reușit să obțină o astfel de valoare a lui Ho cu o alegere aleatorie (vezi exercițiul ) Secvența se va repeta atunci când o pereche de elemente consecutive se întâlnesc a doua oară Perioada maximă este tp (Vezi exercițiul următor ) După o alegere arbitrară a lui Xo, ,Xk-i, fie Xn+i = f(Xn, ,Xn *+i), unde -> -> , care combină șapte cicluri Doar de semințe duc la o repetare a Algoritmul K este un generator de numere aleatoare teribil! Dacă / este într-adevăr o funcție aleatorie, atunci aceasta ar fi ideală; dar cum să construiești un astfel de /? Funcția definită de algoritmul K ar funcționa mult mai bine cu această schemă, deși are proprietăți non-aleatoare (a se vedea răspunsul anterior) Funcția / își rearanjează elementele ciclice; fie (a?o, • • •, reprezentarea "neobișnuită" inversă acestei permutări Apoi continuăm să definim Xk, , xm-i, ca în Exercițiul - [Vezi J Combinatoria Teoria ( ), - ] Astfel, dacă m = și (/( ), ,/( )) = ( , , , , , , , , ), obținem (xo,- - ,xd) = ( , , , , , , , , , ); dacă (a?o, • • •, a?e) = ( , , , , , , , , , ), obținem (/( ), , / ( )) = ( , , , , , , , , , ) SECȚIUNEA Alegeți ca numerele Xo și a să fie pare și ac să fie impare Atunci Xn va fi impar pentru n > Fie X prima valoare repetată a secvenței Dacă Xr este egal cu Xk pentru unele k, unde , n - k > Dacă a și m nu sunt coprime, atunci este imposibil să se determine Xn-i când este dat Xn; multipli de m/gcd(a,m) pot fi adăugați la Xn- fără a modifica valoarea lui Xn (Vezi și exercițiul - ) SECȚIUNEA Fie c' soluţia ecuaţiei ac = c modulo m (Astfel, c' = a'cmodm dacă a' este numărul din răspunsul la exerciţiul - ) Atunci LDAX; ADĂUGAȚI CPRIME; MUL A Depășirea este posibilă la operațiunea de însumare (Din rezultatele de mai târziu în acest capitol rezultă că ar putea fi mai bine să economisiți o unitate de timp setând c = a și înlocuind operația ADD cu operația INCA Apoi, dacă Xq = , depășirea nu va avea loc până când sfârșitul perioadei, astfel încât să nu fie niciunul ) RANDM STJ LDA MUL IF XRAND F B F XRAND SLAX ADD STA H JNOV * JMP XRAND CON Xo H CON a zn CON c (Sau INCA s dacă s nu este suficient) Fie a' = aw mod mn şi fie m' astfel încât mm' = (modulo w) Fie y w, scade w - (Depășirea nu este posibilă la acest pas ) | ca însumare pe un singur computer e-bit de complement Cometariu Asa de produs mod ( e - ), atunci puteți combina tehnica din exercițiu și , efectuând operația (yz) mod ( e - ) prin însumarea celor două jumătăți e-bit ale produsului yz pentru toate numerele completate de y și z, indiferent de semn (a) Ambele părți ale egalității coincid cu expresia aq\ x/q\ (b} Fie t -m Este clar că a(zmodg) qnx = m - , atunci r\ x/q J > (g + l)(a + ) > m Astfel, condiția r y/mn-, ele includ și cazuri pentru a = i dacă (Ym mod ) , atunci transferul se face spre stânga Și dacă acest transfer acoperă întregul drum la stânga lui x$, se efectuează nu numai către poziția xd, ci și către poziția x? Se poate răspândi de la r si r pana la oprirea procedurii (Numerele pot fi, de asemenea, puțin mai mari decât m De exemplu, ajunge la = m + , care ajunge la = m + Dar suprareprezentarea nu este neapărat dăunătoare ) (b) Aceasta este operația de împărțire cu Faceți inversul lui (a): mutați cifra de ordin superior la stânga și scădeți noua cifră de ordin superior din a treia cifră din stânga Dacă rezultatul scăderii este negativ, "împrumutăm" în mod obișnuit (algoritmul S), adică micșorăm cifra anterioară cu Împrumutul se poate extinde, ca în (a), dar nu dincolo de poziția cifra de ordin superior Această operație păstrează numerele nenegative și mai mici decât m (Astfel, împărțirea la este mai ușoară decât înmulțirea cu ) (c) Puteți stoca bitul împrumutat în loc să îl propagați, deoarece poate fi inclus în procesul de scădere în pasul următor Astfel, dacă definim cifra xn și biții împrumutați bn prin formula recursivă Xn = (zn-io - (r)n-z - bn) mod = a?n-u - xn-z - bn + bn + i, apoi, folosind inducția pe n, putem obține " mod = Xn, unde Xn "(Xn - Xp - Xp - ZXp - Xp - Xp ~ vXp - Xp + Xp + iXp ') IO YuOObp + (Xn - Xn - • ■ ■ Xn - u) (xn - Xn - Xn - s')іO bn în condiţii iniţiale Xo = Reţineţi că Xn+ = ( XnXn - Xn - Xn - Xn - Xn - Xn - bXn + Xn + Xn + ) bn + = mXn " Xn J deci (d) Dacă ; mărimile x- , , xk și bo trebuie să fie astfel încât Valorile x: pentru j (b) În aceste circumstanțe, f Se obține ±x = (modulo ^) și ±x (modulo ^+I) și f > Prin urmare, aplicând lema P, constatăm că (iz) φ (modulo e), în timp ce a; ' = (iz) * = (modulo e) Astfel, ordinul este un divizor al lui e ^, dar nu este un divizor al lui e ^ (c) are ordinul ; e - - ordinul ; perioada maximă, unde'e > , este deci e- , iar pentru e > este necesar ca f = , adică x ~ ± (modulo ) Dacă k este un divizor al lui p - și dacă ak = (modulo p), atunci prin Lema P acr' = (modulo re) În mod similar, dacă ap = (modulo p ), constatăm că a fj Atunci ap și ap au perioade coprime Ai/ai și respectiv Ar/kg În plus, (Ai/i)(Ar/kg) = A Astfel, este suficient să luăm în considerare cazul când Ai și Ar sunt numere coprime, adică atunci când A = AiAg Acum, deoarece (aiag)A = , obținem = (aiag)LL = a^ ; de aici rezultă că AAi este un multiplu al Ag Aceasta implică faptul că A este un multiplu al lui Ag, deoarece Ai și Ag sunt numere coprime În mod similar, A este un multiplu al lui Ai; înseamnă că A este un multiplu al AiAg-Este evident că (ayug) * * = ; astfel, A \u d AiAg- (b) Dacă ai este de ordinul A(m), ai este de ordinul A, rezultă din (a) că A(m) este un multiplu al lui A Pe de altă parte, se poate găsi un element de ordin superior , și anume A(t)) (a) f(x) = (z - a)(zn + (a + ci)zn -|-F (an l -F cn-i)) + f(a) (b) Enunțul este evident când n = Dacă a este o rădăcină, atunci /(z) = (z - a)g(z); deci dacă a! altă rădăcină = f(a") = (a - a')q(a') Deoarece a' - a nu este un multiplu al lui p, a trebuie să fie o rădăcină a lui g(z) Deci, dacă /(z) are mai mult de n rădăcini distincte, atunci g(z) are mai mult de n - rădăcini distincte, (c) A(p) > p - , deoarece /(z) trebuie să aibă grad > p - pentru că are atâtea rădăcini Dar prin teorema F, A(p) ej pentru tot j Modulul trebuie să fie divizibil cu sau cu p (pentru numere prime impare p) pentru ca potențialul să fie egal cu Numai valorile m \u d + și IO - vor fi astfel de a' = ( - b+b -) mod m, unde termenii b , b + etc sunt omiși (dacă s este un potențial) Deoarece Xn este întotdeauna impar, Xn+ = ( + • + )Xn mod = ( + Xn+i - Xn) mod Dacă sunt date U" şi U"+i, atunci posibilităţile pentru K+ "( + (Yn+ + ei) - (Yn + e )) mod , Dacă d (modulo p), atunci dz + ax + c = d(x + u) + ci (modulo pe) pentru unele numere întregi ai și ci și pentru toate numerele întregi x Această formă pătratică ia aceleași valori în punctele x și - x - ai, deci nu poate lua toate valorile pe modulul pe Prin urmare, d = (mod p), iar dacă a = , atunci dx + ax + c = x (mod p) ar fi valabil pentru unele x, ceea ce contrazice faptul că o secvență mod p are o perioadă de lungime p Pentru a arăta suficiența condițiilor, putem folosi Teorema A și luăm în considerare câteva cazuri banale în care m = pe, unde e > Dacă p = , atunci este clar că Xn+ = Xn + (modulo ); dacă p = , obținem Xn + = Xn - d + c (modulo ) folosind (i) și (ii) Pentru p > , putem demonstra că Xn + p = Xn + pc (modulo p ) după cum urmează Fie d = pr, a = + ps Atunci, dacă Xn = cn + pYn (mod p ), trebuie să obținem Yn+ = n c r + nes + Yn (mod p); deci Yn = ( ) c r + (^(c r + cs) (mod p) Astfel, Yp modp = , iar relația este demonstrată Acum putem demonstra că șirul (Xn) de numere întregi definite în "indicație" satisface relația Xn+pf = Xn + tpf (modulo p/+ ), n > , pentru unele t cu t modp / și pentru toate f > Acest lucru este suficient pentru a demonstra că o secvență (Xn modpe) are o perioadă de lungime p dacă lungimea perioadei este un divizor al lui pe, dar nu un divizor al lui pe Relația de mai sus a fost deja stabilită pentru f = , iar pentru f > se poate obține prin inducție după cum urmează Lăsa Xn+p/ = Xn + tp} + znp!+ (modulo p/+ ); atunci rezultă din legea pătratică pentru generarea unei secvențe cu d = pr și a = + ps că Zn+ = rtnc + st + Zn (modulo p) Prin urmare Zn+p = Zn (modulo p) Prin urmare, Xn+kpf = Xn + k(tpf + Znp/+ ) (modulo p/+ ) pentru k = , , , Dacă punem acum k = p, atunci demonstrația va fi finalizată Cometariu Dacă /(z) este un polinom de grad mai mare decât și -Xn+i = f(Xn), analiza este ceva mai complicată, deși se poate folosi faptul că f(m + pfc) = /(m) + pkf'(m') + p kf"(m)/ ! + ■ ■ •, pentru a demonstra că multe secvențe polinomiale au o perioadă maximă De exemplu, Coveyou a demonstrat că perioada este m = e dacă /( ) este impar , f'(j) = , /"(j) = și f(j + ) f(j) + (modulo ) pentru j = , , , [Studii în matematică aplicată (Philadelphia: SIAM, ), - ] Fie Xn = Yn + ; atunci şirul Yn satisface relaţia de recurenţă pătratică Yn+i = ( Yn + 'n + ) mod e- Cazul : Xo = , Xi = ; deci Xn = Fn Căutăm cel mai mic n pentru care Fn = și Fn+i = (modulo e) Deoarece Fin = Fn(Fn-i + Fn+i), fn+i = F + F +i, aflăm prin inducție pe e că pentru e > T e-i = și T e-i +i = e + (modulo e+ ) Aceasta înseamnă că perioada este un divizor de - e~ , dar nu - e~ Prin urmare, perioada este fie • e \ sau e Dar F "-i este întotdeauna un număr impar (deoarece numai Fin este par) Cazul : Xo = a, Xi = b Atunci Xn = aFn-i + bFn Trebuie să găsim cel mai mic n pozitiv astfel încât a(Fn+i - Fn) + bFn = a și aFn + bFn+i - b Aceasta implică faptul că ( - ab - a )Fn = , (b - ab - a )(Fn + i - ) = Și b - ab - a este impar (adică este simplu în raport cu mn) Deci, condiția este echivalentă cu Fn = , Fn+i = O metodă pentru determinarea perioadei Fn pentru orice modul a fost prezentată pentru prima dată într-un articol al lui D D Wall (DD Wall, AMM ( ), - ) Alte fapte despre secvența Fibonacci modulo e au fost găsite de B Janssen (B Jansson, Random Number Generators (Stockholm: Almqvist &c Wiksell, ), Secțiunea C ) (a) Este ușor de observat că zx = l + /(z)u(z) + pev(z) pentru unele u(z) și v(z), unde v(z) (modulo /) (z) și p Conform teoremei binomului zĂp = + pe+ v(z) +p e+ v(z) (p - l)/ plus următorii termeni congruenți cu zero modulo f(z) și pe+ Deoarece pe > , atunci zXp = + pe+ v(z) modulo f(z) și pe+ Dacă pe+ v(z) = modulo /(z) și pe+ , atunci trebuie să existe polinoame a(z) și (z) astfel încât pe+ (v(z) + pa(z)) = /(z)b(z) Deoarece f( ) = , obținem că b(z) este un multiplu al lui pe+ (după Lema Gauss G) Prin urmare v(z) = modulo /(z) și p Ca urmare, se obține o contradicție (b) Dacă zx - = f(z)u(z) + pev(z), atunci G(z) = u(z)/(zX - ) + pev(z)/f(z)(zx - ); deci -An+g = An (modulo pe) pentru n mare În schimb, dacă (An) are ultima proprietate, atunci G(z) = u(z) + v(z)/(l - zx) + peH( z) pentru unele polinoame u(z) și v(z) și unele serii de puteri H(z) astfel încât seria de polinoame să aibă coeficienți întregi Aceasta implică egalitatea - zx = u(z)/(z)(l - zx) + v(z)f(z) + pe/ (z)/(z)(l - zA) și H' ( z)/(z)(l - zx) este un polinom, deoarece celălalt termen al egalității este un polinom (c) Este suficient să demonstrăm că inegalitatea A(p') / A(pe+ ) implică relaţiile A(pe+ ) = pA(p') / A(pe+ ) Din (a) și (b) rezultă că A(pe+ ) / pA(pe) și că A(pe+ ) este un divizor al lui pA(pe), dar nu al lui A(pe) Prin urmare, dacă A(p') = pfq, unde q modp / , atunci A(pe+ ) trebuie să fie egal cu p^+ d, unde d este un divizor al lui q Dar acum Xn+p/+i = Xn (modulo pe); deci p?+ld este un multiplu al p^q și d = q [Cometariu Presupunerea că p' > este necesar; de exemplu, dacă ai = , ar = - , k = , atunci (An) = , , , , , , ; A( ) = , A( ) = , A( ) = ] (d) ff(z) = Xo + (Xi - aiXo)z + • • • + (Xk-i - aiXk- - azXb- - ■ ■ ■ - ak~iXo)zk~ (e) Afirmația (b) poate fi generalizată la G(z) = g(z)/ f(z)- prin urmare ipoteza că lungimea perioadei este A implică că p(z)(l - zx) = modulo / (z) și pe Mai sus, a fost luat în considerare doar un caz special pentru p(z) = Dar ambele părți ale acestei comparații pot fi înmulțite cu polinomul Hensel (z) și obținem că - zx = modulo f(z) și pe Cometariu O demonstrație mai "elementară" a rezultatului din (c) poate fi obținută fără ajutorul generatoare de funcții, dacă folosim o metodă similară cu cea aplicată în răspunsul la Ex Dacă Ad + P = An + reBp pentru n = r, r + , , r + k - și unele numere întregi Bn, atunci aceeași relație este valabilă pentru tot n > r, dacă definim Br+ k, Hr+fc+i, prin relația recursivă dată Deoarece secvența rezultată pentru Bn este o combinație liniară a deplasărilor secvenței An, obținem B\+n = Bn (modulo pe) pentru toate valorile suficient de mari ale lui n Acum A(pe+ ) trebuie să fie un multiplu al lui A = A(pe) Pentru toate n suficient de mari, aveți relațiile An+>l = An + p'(Bn + Bn+x + Bn+ x + ■■■ + Bn+ i)A) = An + jpeBn (modulo p e) pentru j = , , , Nici unulA: Bp consecutive nu sunt multipli ai p; aceasta implică imediat relațiile A(pe+ ) = pA(pe) / A(pc+ ) pentru e > De asemenea, este necesar să se demonstreze că A(pe+ ) pA(pe) când p este impar și e = Punem Bx+n = Bn + pCn și observăm că Cn+x = Cn (mod p) când n este suficient de mare Atunci An+P = An + p (Bn + ( )SP) (modulo p ), iar demonstrația este completă Istoria acestei probleme poate fi găsită în Morgan Ward (Trans Amer Math Soc ( ), - ); vezi, de asemenea, DW Robinson, AMM ( ), - Lungimea unei perioade modulo nu poate fi mai mare de Lungimea unei perioade modulo e+ nu poate fi mai mare de două ori lungimea perioadei maxime mod e Aceasta rezultă din exercițiul anterior Prin urmare, lungimea perioadei maxime posibile este e+ Se realizează, de exemplu, în cazul banal când a = , b = c = , Este evident că Zn+x - Zn, deci A' este un divizor al lui A Fie cel mai mic multiplu comun al lui A' şi Ai egal cu X\, iar A să fie definit în mod similar Relațiile Xn + Yn = Zn = Zn + X'i = Xn + Tn + A' sunt valabile, prin urmare Ai este un multiplu al lui Ag În mod similar, se poate demonstra că A este un multiplu al lui Ai Acest lucru dă rezultatul dorit (Este "cel mai bine posibil" în sensul că secvențele pentru care A' = A pot fi construite în același mod ca și secvențele pentru care A' = A ) Algoritmul M generează (Xn+*, UP) la pasul M și dă Zn = Xn+k- n la pasul M pentru toate n suficient de mari Astfel, (Zn) are o perioadă de lungime A', unde A ' este cel mai mic număr întreg pozitiv astfel încât Xn+b-nn = A'n+A , k Într-adevăr, obținem că Xnj = a\X(n-V)i + • • ■ + akX ^nk )j când prin inducție obținem Xnj = A(n | i)(j ) - Xn = a,X(n+ i)y i) - aj i yj, Astfel, există șiruri (p, A) de tip B pentru toate astfel de p și k Pentru a obține o secvență (pe, A) de tip B, luăm e = qr, unde q este o putere a lui p și r nu este un multiplu al lui p Începem cu o secvență (p, drA) de tip A și anume Xo, Xi, X , • •; apoi folosind sistemul numeric cu baza p cifre grupate (Xo • • ■ Xh ~ i) p, (Xq Al -i) p, • formează o secvență (p , rA) de tip A, deoarece q și pqrk - sunt numere coprime și secvența are o perioadă de lungime pqrk - Aceasta duce la o secvență (p , rA) (Yn) de tip B , și (YoYi Vr i)p", (VrVr + • lZ r-i)₽", • • ■ sunt secvențe (pqr, A) de tip B Demonstrarea este similară, deoarece r și pqk sunt numere coprime Pentru a obține o (m, /^-secvență de tip B pentru m arbitrar, se poate combina (pe, /^-secvențe pentru fiecare putere a unui factor prim m, folosind teorema chineză a restului, dar există o metodă mai ușoară Fie că {Xn} fie ( r, f-secvență de tip B și fie (Yn) un (s, f-secvență de tip B, unde r și s sunt numere coprime Atunci (sXn + Yn) este un (rs, f -secventa de tip B O construcție uniformă simplă care produce ( , ^-secvențe pentru k arbitrar) a fost descoperită de A Lempel (IEEE Trans C- ( ), - ) Folosind teorema chineză a restului, se pot găsi constantele ai, ,ab care au resturile dorite modulo fiecare divizor prim al lui m Dacă m = P P • • Pt, lungimea perioadei este lcm(pf - , , p* - ) Într-adevăr, este posibil să se obțină o perioadă acceptabil de lungă pentru un m arbitrar (nu neapărat fără pătrat), așa cum se arată în exercițiu unsprezece Scăderea poate fi mai rapidă decât însumarea (vezi exercițiul - ); lungimea perioadei este tot e ( - ) conform ex R Brent (R Brent) a observat că atunci când se folosesc numere în virgulă mobilă, calculele pot fi făcute exact în [ ) (vezi exercițiul - ) Inversați secvența Cu alte cuvinte, dacă Zn - Y n, atunci Zn = (Zn k+i - Zn-k) mod = (Zn k+i + Zn k) mod Această idee vă va ajuta să evitați cea mai mare parte a timpului petrecut cu accesarea programelor De exemplu, să presupunem că programul A este apelat de instrucțiunea JMP RANDM, unde RANDM STJ F LDA Y, * Programul A ENT H JMP * Costul utilizării unor astfel de numere aleatoare este de + unități de timp Dar să presupunem că nu ne referim la acest program, ci la programul de obținere a numerelor aleatoare RNGEN: DEC ; J ZRNGEN;LDA Y, RNGEN STJ F ENT ENT LDA Y LDA Y+ , ADD Y+ , ADAUGĂ Y STA Y STA Y+ , DEC DEC J P ♦- J P ♦ - ENT H JMP ♦ Acum costul este doar ( + [O notație C similară este folosită în The Stanford GraphBase (New York: ACM Press, ), GB FLIP ] Într-adevăr, în multe cazuri este de preferat să se genereze întreaga matrice de numere aleatoare În plus, abordarea de mai sus este obligatorie atunci când aleatoritatea este îmbunătățită de metoda Liischer (vezi programele în limbaje algoritmice C și FORTRAN în secțiunea ) Fie Jn = [fcXn/mJ Lema După (k + k - )/ valori consecutive fc + x ok + i (A: - ) O apar în secvența (Jn), algoritmul B va satisface inegalitățile V[r] ; dacă jn € Sn și Jn = , atunci Sn+i = Sn și jn+i - După k + zerouri consecutive, trebuie să fie valabile € Sn și jn+i = Apoi, după " * :+ " trebuie să dețină { , } Cu Sn și jn+i = ; după " *", { , , } se execută cu Sn și jn+i = ; etc Consecinţă Fie I = (k + k - )/ Dacă A > Ik , atunci fie algoritmul B oferă lungimea perioadei A, fie secvența (Xn) este prost distribuită Dovada Probabilitatea ca orice circuit dat J de lungime I să nu apară într-o succesiune aleatorie de lungime A este mai mică decât ( - k- )x^ , atunci este necesar A > , deci acest rezultat este pur academic, dar sunt posibile și limite mai mici ) Următorul algoritm realizează aproximativ k operații în cel mai rău caz Dar timpul mediu de execuție al operațiunilor este mult mai mic; poate O(logfc) sau chiar ( ) XI Atribuiți (ao, ai, • • •, a*,) -(al, , Xk, m- ) X Fie i minimul pentru a; > și i > Rulați programul Y pentru j = i + , , k, atâta timp cât a/c > HZ Dacă ao > a*, Y(ti, , Xk) = ao; în caz contrar, dacă ao > , /(al, ,xx) = ao - ; în caz contrar /(al, ,Tfc) = a*, eu Y Atribuiți I (aj, ,a +*, i) Scăderea a* este necesară pentru a face că această inegalitate este adevărată Se presupune că a>+ = ai, a*,+ = ai etc ) Y Dacă ai+i > aj+i, ieșiți din program În caz contrar, dacă j+l = k, atribuiți a*, -a,+i În caz contrar, dacă a k, micșorați a cu și ieșiți din program În caz contrar, atribuiți a* - și părăsiți programul Y Creșteți Z cu și reveniți la pasul Y dacă I fo(x) (modulo și Da;)), de aici urmează afirmația indicației Argumentând astfel, putem demonstra că a; Xn = (qn+i-Vo + adn)/(qnXo + adn i) și xn mod f(x) = qnx + adn i pentru n > Astfel, dacă Xo = , atunci -Vn = dacă și numai dacă xn mod f(x) este o constantă diferită de zero Din condițiile (i) și (ii) obținem că f(x) este ireductibil Dacă f(x) = (a; - rі)(x - r ) și Г Г , atunci x₽ = dacă n / r și xp = rі dacă n = r Fie £ o rădăcină primitivă a unui câmp cu p elemente și să presupunem că £ k = Ckqk + ak Polinoamele cuadratice, după cum a fost stabilit, sunt exact polinoamele fk(x) = x - CkX - ak, unde Prin urmare q " + ad " i = q "+i + ad " + e+ (modulo e+ ) IA' - = (d "- +i+ad e- )/(d e- +ad "- i) (modulo e), în timp ce -V "-i = Și invers: este necesar ca un mod = și c mod = , în caz contrar Xsn = (modulo ) [Cm (Eichenauer, Lehn şi Topuzoglu, Math Comp ( ), - ) ] LSB-ul acestei secvenţe are o perioadă scurtă, deci este preferat un generator invers cu un modul simplu Se poate presupune că bi = Din exercițiu rezultă că un vector tipic din V este vectorul (x, (s x + as )/(s X + as ), , (s'dx + asd)l(sdx + asd)), unde Sj = qt>j, s'j = Qbj+i, s" = qi^-i- Aparține hiperplanului H dacă și numai dacă , Г ' ' ' ' ' ' ' ' ' V = doar puțin mai mult decât valoarea obținută prin folosirea zarurilor bune! Există două motive pentru care nu am stabilit că zarul este fals, (a) Noile probabilități (vezi exercițiul ) nu sunt de fapt foarte departe de cele date în ( ) Suma citirilor a două zaruri tinde să netezească probabilitățile Dacă în loc să însumăm fiecare dintre cele de perechi posibile de valori, probabil că s-ar putea face diferența mai repede (presupunând că zarurile se pot distinge) (b) O explicație mult mai importantă este că n este prea mic pentru a capta o diferență semnificativă Dacă același experiment ar fi efectuat pentru un n suficient de mare, atunci falsul ar fi dezvăluit (vezi exercițiul ) Pz = хі Pentru h/ a fost realizat cu o probabilitate foarte mică; atunci |Fn(i) - F(x)I va fi incredibil de mare pentru distribuția ipotetică F(x) ("max" ar trebui de fapt înlocuit cu "sup" deoarece se referă la cea mai mică limită superioară Cu toate acestea, notația "max" a fost folosită pentru a nu deruta cititorii care nu sunt familiarizați cu notația "sup" ) Să presupunem, pentru comoditate, Xo - - oo, Xn-u = + oo Dacă Xj n (a) Dacă [mF(X,)J = [mF(Xj)J și i > j, atunci i/n - F(Xt) > j/n - F(Xj) (b) Începe ca*, = , , bk = , și ck = pentru : atribuiți r~ - max(r', ot - j/n), j - j + ck, r+ - max(r+, j /n-bk) În cele din urmă atribuiți K/ - y/nr+, K~ - \/nr~ Timpul necesar este O(m + n), iar valoarea exactă a lui n trebuie cunoscută în prealabil (Dacă estimatorul (k + |)/m este utilizat pentru a* și bk, astfel încât doar valorile lui c să fie calculate efectiv pentru fiecare k, obținem estimări pentru K/ și Kn în ți/n/m, chiar când m r este egală cu probabilitatea ca r Uj succesive să se afle în afara regiunii date, și anume ( - p)r Probabilitatea ca lungimea unui interval r să fie exact egală cu probabilitatea ca lungimea unui interval > r minus probabilitatea ca lungimea unui interval > (r + ) Deoarece N tinde spre infinit, n (cu probabilitatea ) tinde și spre infinit, deci acest test este exact același cu testul interval descris în secțiune, cu excepția lungimii intervalelor foarte mari Iar criteriul de inter- Rolurile unei secțiuni date au cu siguranță o distribuție x asimptotic, deoarece lungimea fiecărui interval este independentă de lungimile altor intervale [Cometariu O dovadă completă a acestui rezultat este dată în E Bofinger și VJ Bofinger Annals Math Stat ( ), - Această lucrare merită atenție deoarece discută câteva variante interesante ale criteriului intervalului Autorii au arătat, de exemplu, că valoarea (K- - (Np)pr) ПѢ, (Np)pr nu se apropie de distribuția ^, deși această statistică (alți autori s-au referit la ea ca un criteriu "strict") a fost considerat anterior un criteriu "mai puternic", deoarece Np este egal cu valoarea așteptată a lui n ] , , , , , , , Vezi ex cu w = d (Înlocuiți d cu w în pașii C și C ) Apoi obținem d(d - ) (d - w + ) fi - ) Pr - : ? pentru w , creșteți C UNT[ ] cu , în caz contrar creșteți C UNT[r] cu R [Sfârșit?] Dacă j t Acest lucru este valabil întotdeauna pentru F(X) când F este continuă și X are distribuția F (vezi observația după formula -( )) (a) Zjt = max( d( !), Z +i)(f i)) Dacă este stocat în memorie, atunci este suficient să convertiți pur și simplu această matrice într-un set de Zjt fără a utiliza memorie suplimentară (b) În "îmbunătățirea" sa, fiecare Vk trebuie să aibă de fapt distribuția necesară, dar observațiile nu sunt independente pentru valori mari ale lui Vk Într-adevăr, atunci când Uj este o valoare relativ mare, atunci toate Zjt, Ztj ijt, , Zy f+ )f va fi egal cu Uj, astfel încât efectul repetării acelorași date de t ori este posibil (V va fi înmulțit cu t, ca în exercițiul - ) (b) După identitatea lui Binet, diferența este {V/ - UjV/ = pentru toate perechile j, k De aici rezultă că matricea (u u { u^L = n(n - )E(nS- - S ) + nEU^/D și EX/D = nE(U Ui/D) Aceasta implică egalitatea = E(nS- - S }/D = - (n - ) E (nX - S ) / D (Strict vorbind, E Si / D și E S / D pot fi infinite, așa că trebuie avut grijă ca este posibil să se lucreze numai cu combinații liniare de mărimi așteptate despre care se știe că există ) Să Eish, Ezi E , E și El înseamnă valorile EțUoUilhUs/D ), E(UțUxU /D }, E(UgU?/D ), E{U^Ux/D ), respectiv E(U$/D ) Atunci ES /D = n(n - )E + nEl, Et&Si/D ) = n(n - l)(n - )E c + n(n - )E + n(n - )E + nL , E Sx/D - n(n-l)(n - )(n -+ n(n-l)(n - ')E + n(n-l)E + n(n- ) E + nEl , EX /D = n(n- )Ecc + nE n-YnEzz, E(XS /E ) = n(n - )(n - )£^i -L n(n- )E ? iiЧ- пЕзз + пЕзі, E((Uo - ІЛ) / О ) = E - E + El, de unde urmează primul rezultat Fie S = a(( nn)/n) ?/ , M = a / + / și m = fl/J-] Dacă împărțim aria de distribuție în m părți la fel de probabile, atunci putem arăta că fiecare parte conține numărul de puncte egal cu numărul situat între n - O(n~ m) Pentru aceasta, trebuie utilizate inegalitățile de coadă -( ) și ( ) Prin urmare, dacă distribuția este uniformă, D = -En ( + ( )), cel puțin pentru aceste probabilități Dacă D nu este în această regiune, atunci k În special, dispersia în acest caz este exact egală cu /(n + ) - /(n - I) [Analele matematicii stat ( ), - ] Valorile secvențiale cr-i - s - la pasul P sunt , , , , , , , , ; prin urmare f = , = ! + ■ ! + ■ ! + ■ ! + • ! + • !, astfel încât valorile succesive ale lui sl la pasul P să fie egale cu , , , , , , , , Dacă mergem acum în direcția opusă, obținem o permutare ( , , , , ) Fie P'(xlt ,xt) = £ ЕІЕоЧО^i • • • ,K+f i) = (хі, ,zt)] Apoi Q(xx, ,xt) = Y P'(yi, - -,yt)P((xi - yi) modd, (xt - yt) modd) (vl Vi) sau, mai compact, Q(x) = P'(y)P(x - y) Prin urmare, folosind inegalitatea generală (EX) De exemplu, dacă d = , t - , a = și fi = , atunci ca/z = P( ) P( ) x (P( ) + P( ) + P( ) - ) Elementul afi CCC este deci egal cu P(afi) ori d- X E wv £ E w r*)(k(a'b) - vw, • | |=tl а,І>= |fc| este egal cu suma P(c Ct- ), care este egală cu Dacă t = , aceeași sumă ar trebui să fie egală cu K(ai, bi), dar ar trebui să să nu fie incluse în suma P( yab)K( : a, ya : )(- )K( : yb, fi : ) Prin urmare, rezultatul este zero, cu excepția cazului în care inegalitatea k De exemplu, când t - , toate aceste rapoarte se situează între - , și - , ; când t = , atunci toate se află între - , și - , Acest fenomen necesită o explicație (a) Vectorul (Si, , Sn) este un punct uniform distribuit în politopul (n - )-dimensional definit de inegalitățile Si > , , Sn > pe hiperplanul Si + • ■ ■ + Sn = - Este uşor de demonstrat prin inducţie că goo /'oo goo ( dti I dt - - dtn i[l-ti Si •'" •'"nl tn-l'fi Sn]- ( - Si - - ' ■ ■ - Sn) + (nl)! Pentru a obține probabilitățile, împărțim această integrală la valoarea ei în cazul particular când Si = • • ■ = zn = [vezi Bruno de Finetti, Giornale Istituto Italiano degli Attuari ( ), - ) (b) Probabilitatea ca S s să fie egală cu probabilitatea ca Si > s, , Sn > s (c) Probabilitatea ca S^j > s este egală cu probabilitatea ca cel puțin fc - din Sj să fie s, , Snfis, iar această probabilitate este egală cu Pr(Si , Sj+i > s, ,Sn > s) - Pr(Si s , , Sn > s) Aplicarea repetată a lui (a) arată că ; prin urmare, - Fk(s) = £(") (nk ~ [ ~ J ) (- ) * -'- ( - (n - Oz); - În special, distribuția S(n) are cea mai mare diferență s s - - E (;) - (" - , , Sn > Este format din n! subpolitopii congruenți definiți prin ordonarea Sj (presupunând că Sj sunt diferiți), iar operația de sortare este de la n! plierea politopilor mari din subpolitopi în care Si y Reîncercările sunt, în esență, mutarea reprezentării binare la stânga cu un bit, ceea ce poate completa rezultatul După cel mult e + iterații pe numere cu cifre e, procesul trebuie să convergă către un punct fix ( , ) Codificarea permutației pentru n = corespunde pur și simplu convoluției și întinderii liniei; primele patru niveluri de partiții au următoarele coduri pe patru biți ( , ) I , -, , , - OON ONO - - - ( , ) Această secvență se potrivește exact cu codul binar Gray discutat în Secțiunea În cazul general, într-un cod de permutare într-un sistem numeric cu baza n! pentru un n-simplex, regiunile adiacente au coduri identice, cu excepția unei cifre După fiecare iterație a transformării diferenței, cifra din stânga este eliminată din reprezentarea fiecărui punct Rețineți că diferențele egale ale zilei de naștere sunt puncte de lângă limita de descompunere la primul nivel Transformarea fundamentală de la (Si, ,Sn) la (SJ, , S'n) este implicată în demonstrația lui Whitworth a Propoziției LVI din ediția a cincea a Choice and Chance (vezi bibliografia din răspunsul la exercițiu) ) A fost studiat pentru prima dată în detaliu de J Durbin (J Durbin, Biometrika ( ), - ), care s-a inspirat din construcții similare ale lui P V Sukhatme (R V Sukhatme, Annals of Eugenics ( ), - ) ) Codificarea permutării pentru diferențele repetate a fost introdusă de H E Daniels (H E Daniels, Biometrica ( ), - ) (a) Numărul de partiții m în n părți pozitive distincte este pn(m - ("J )) după cum urmează din Exercițiul - Aceste partiții pot fi permutate în n moduri pentru a forma rânduri n-dimensionale (j/i, astfel încât yi = și izn) (zn -bn zn)fw \bl / w\bn- n! (n - )! zn ci cn-i(l - z) ( - z") kzn 'kz / unde c*, = + ftfc +bkbk-i -hbk • • • b?bi = l + bfcCfc i (Cazul special pentru w = este interesant, deoarece partea stângă se însumează la ( - z) n/n! ) Aceasta este o problemă bună pentru metoda trecerii [vezi N G de Bruijn (NG de Bruijn, Asymptotic Methods in Analysis (North-Holland, ), capitolul )] Egalitatea p"(m) = ^u este adevărată unde f(z) = -mlnz - ln(l " zk)- Fie p - n/m și = y/n/m-, integrarea de-a lungul traseului z = e~p+m dă pn("n) = exp(f(e~p+M)) dt Confortabil folosiți egalitatea (se - și+Ș+ i dintr-o altă egalitate convenabilă, \z ^ n ■ n! Astfel, am obținut o formulă asimptotică pentru integrandul exp f(e~p+,ts') = exp f - ^ i?V(e~p)^ = e >o unde ci = (n^y:^B + n-"-^-B p)S + O(n~ ), etc , și rezultă că c, = O(n ) Pentru j > Punerea parantezelor o constantă, obținem -eJV ' = ; -exp -> > m~r,k p tg vn\pne~mP \ / /ptp ,'el+°' / a - a a - a + a X ~ tg n! n"\+T n+ n +')' care conduce la o integrală al cărei integrand este exponențial mic când | | > nu Valorile mari ale lui t pot fi neglijate, deoarece expansiunea în fracții elementare arată că integrandul are ordinul O((m/n)n/ ) Niciuna dintre celelalte rădăcini ale unității nu apare de mai mult de n/ ori ca pol numitor În consecință, a fost admisă existența "cozilor grele" [vezi CMath, § ] și integrat peste tot t Formulele e~l / tJ dt = (j ~ ) - ) (I)ѵ^tr [j este par] si n! = (n/e)">Y rpexp(^n + O(n- )) sunt suficiente pentru a finaliza calculul Cu n(u) = Pn(mn - ("+ *)) în loc de pn(m) calculele se fac în același mod, dar cu ci crescând cu ^(n / - n- ^ ), și cu un factor suplimentar exp(-p(n > )) Se obține tp- e~a^ L a a - a - a + a ",-zL Sh = n! (p~ )! \ ~ p - ^ +°(p V ' care este aceeași cu formula pentru pn(m), dar a este înlocuit cu -a Într-adevăr, dacă definim pn(m) = rn( m + ("+ )) și gn(m) = rn( m - (n )), funcția generatoare Rn(z) = Srarn(z(tm)) = IIfc =i (z fc - r*)- satisface egalitatea fln(l/z) = (-l)nfln(z) Aceasta implică formula de dualitate rn(-m) = (-l)n rn(m) în sensul că ecuația devine o egalitate atunci când rn(m) se exprimă în termeni de polinom în m și rădăcini de Prin urmare, putem spune că gn(m) = pn(-m) În cazul general, o interpretare a lui această dualitate poate fi găsită în lucrarea lui J Polya (cf G Pdlya, Math Zeitschrift ( ), - , § ) (Pentru mai multe vezi G Szekeres, Quarterly J Math Oxford ( ), - ; ( ), - ) Valoarea exactă a lui gn(m) când m = și n = este , x IO ; aproximarea noastră oferă o estimare de , x IO Probabilitatea ca testul zilei de naștere să găsească diferențe R = este bnoo("n)/mn - n! (n - )! m ngn(m) = e~"'/ + O(n ) conform ex , deoarece contribuția de la poi(u) este egală cu ss ^e~a^ - O(n ) Includerea factorului gn(z) = Sk=i(z A: ~ ) în integrandul gn(m) are același efect ca și înmulțirea rezultatului cu | + O(n ), deoarece dp(e~p+a ) = (t)p + O(n p ) + itO(n cu probabilitatea (| + e) unde s(z) = m + n n(U|?-) - (^tsn-i) inz Este convenabil (și rezonabil) să se integreze de-a lungul căii z = e'", unde = /(m + n) și u = - + it pentru -oo ^ u k = (- )' ( k - )( * - ) (I)Y^, obținem formula asimptotică | + ( m) ^ n(m + n) ^ + O((m + n) ^ ) Dacă m + n este par, atunci aceeași formulă asimptotică este valabilă, deoarece dăm jumătate coeficient la z((tm)+ n)/ la unu, iar al doilea la zero ( (^)) / + O((m- n)- / ) ) (Acest coeficient este egal cu Numărul de șiruri de lungime n care nu conțin subșirurile date de două litere sau perechile de subșiruri sunt coeficienții lui zn în funcția generatoare corespunzătoare Ele pot fi scrise ca septn + ( ), unde sitele pot fi extinse în puteri de e = /mn Excepție de caz Funcția generatoare c t aa (l+z)/p(z) +e - b + e +e - e + ab /( - mz+z ) +e + e^ + • • • -е -^+ - aa,bb (i+z)/(p(z)+z ) l+ e - e + • • • - e + e - e + aa,bc (l+z)/(p(z)+z +z ) + e - e + • • ■ - b +b - b +- ab, bc (l+z)/(l - mz+ z - z ) + e - e + • • • - e +e - ?+ • ab, cd /( -mz+ z ) + e + + • • ■ - e - +■ • • (Aici a, b, c, d reprezintă litere și p(z) = - (m - l)(z + z ) Se pare că efectul excluderii {ab, ba} sau {aa, ab} este echivalent cu excluderea {aa , bb}; eliminarea lui {ab, ac} este echivalentă cu eliminarea lui {ab, cd} ) Fie Sn coeficientul lui zn în cazul j și fie X numărul total de combinații de două litere care nu apar Atunci EL" = (mSn ) + mn- n ^)/mn și EX = (mSl ' + m (S' ) + S (r)*n itx, seria converge pentru tot x (Reprezentarea din ( ) poate fi privită ca o serie Fourier "finită" în cazul în care x este rațional ) dmax = • De observat că inegalitatea Xn+i , dau considerații similare V (-îy+^-fL- (fij Cy+i) cj~~ În acest algoritm, egalitățile k \u d mj, h \u d mj + i, c \u d Cj, p \u d py-i, P \u d py- , " \u d (-l) j + pentru j \u d , , , t + Dl [Inițializare] Atribuiți A h la , B h la h, p h la , p h la , h la D [Diviziunea ] Atribuiți a h - [fc / AJ, b h - [c / hj, g h - c mod h (Acum a = aj, b = bj și r = cy + ) D [Acumulare ] Atribuiți A h - A + (a - ) s, B h - B + bp (c + r) s Dacă r sau c - , atribuiți A h - A - Zz Dacă h = , atribuiți B h - B + pz (Aici scădem Ze(my+i, su) și luăm în considerare și termenii ^)(-l)j+ /mymy+i ) D [Pregătirea pentru următoarea iterație ] Atribuiți de la h- d, s h -v; atribuie g h- la - ah, la h - h, h h - g; atribuiți r h - ap + p> , p' h - p, p h - r Dacă h > , reveniți la pasul D | La sfârșitul acestui algoritm, p va fi egal cu valoarea adevărată a lui k, deci răspunsul necesar este A + B/p Valoarea finală a lui p va fi egală cu h' dacă s - *)/*J) (((^ + , nu numai când k > z Scriind \ jjk\ - [(J - z)/k\ = I + (( -^£)) - (({)) + - | [ ^ • • • • •! • • ) având lungimea totală egală cu Este adevărat că s(s(t)) |, deci nu poate fi ales pentru a face această probabilitate aproape de cea dorită Faceți ca în exercițiul anterior; suma lungimilor intervalelor este ji f a + t - \ a( (a - ) a( (a - ) \ t ) A a - Pentru a calcula lungimea medie, fie pk egal cu probabilitatea ca lungimea cursei > k Atunci media este / a + k - ' la afc (a - ) t> este ' ' Această valoare pentru o secvență aleatorie adevărată este e - , iar valoarea noastră este e - + (e/ - )/a + O( /a ) [Cometariu Același rezultat este valabil și pentru cursele crescătoare, deoarece inegalitatea Un > Un+i este valabilă dacă și numai dacă - Un Jumătate din pătratul unității în care Uo > Ui, este eliminat, așa cum se arată în Figura A- , cu diferite valori ale lui k notate k > Probabilitățile corespunzătoare pentru secvența aleatorie sunt k/(k + )!- (k + l) )/(fc + )! Tabelul de mai jos compară primele cinci mărimi La- Probabilități pentru șirul lui Fibonacci: | Probabilități pentru o secvență aleatorie: | h P În fig A- prezintă diferite zone pentru cazul general Regiunea înseamnă că U , a = e (modulo e), a = (modulo q), = p = ; m - eq, ± g, e > , a = ± Ze (modulo e), a = (modulo g), = ; m - , a = sau , izf = ^ = (a) Singura alegere pentru (xi,x ) este ^(yi" - !/ " i, - Y W + j/ "n), iar ACEASTA este = i (yiU + y O,U , ~ ! / " - Y (х + x% - |TlT |)(uîl + " ) > " + " * [Rețineți că rezultatul obținut este mai puternic decât Lema A, care afirmă doar că aceasta din urmă poate fi > Ideea este în esență metoda gaussiană de reducere a formei pătratice binare (vezi Disquisitiones Arithmeticae (Leipzig, ), § ) ] Condițiile ( ) rămân neschimbate; prin urmare, h nu poate fi zero la pasul S când a și m sunt numere prime relativ Deoarece h scade întotdeauna la acest pas, S se va termina în cele din urmă cu ti + r > s Rețineți că pp' s > (u - h) + (u - p) în răspunsul anterior, obținem (v - p) > v Prin urmare (u - h) m>p;-i, din care urmează răspunsul Să demonstrăm, folosind condiția ( ), că Uj • Uk = pentru toate k / j dacă și numai dacă când Vj • Vk = pentru toate k / j Să presupunem că Uj • Uk = pentru toate k / j, și fie Uj = a-iVi + • • • + atVt- Atunci Uj ■ Uk = &k pentru toate k Prin urmare, Uj = QjVj și Vj • = • ) = pentru toate k/j Afirmația inversă se dovedește în mod similar Este clar că Pt+i (Іtrz/tr) ^ , adică p (, conține un punct diferit de zero cu coordonate întregi") că рі Se cunoaste un rezultat si mai precis (vezi ( )) ] Identitatea (ui!/ - U !/i) + (uiyi + u y ) = ("u + ul)(yl + y ) implică egalitatea + a = / Dacă a > ^/ , atunci > + a este adevărat, adică - ^/ - |, ceea ce duce la contradicție Deoarece a este impar, yi + y trebuie să fie par Pentru a evita o soluție în care și yi și y sunt pare, punem yi = X + X , Y - X - X și rezolvăm ecuația x + x = mp / x / - e pentru xi L X și chiar xi Factorul corespunzător a va fi soluția ecuației (x - xi)a = z > + xi (modulo e) Nu este greu de demonstrat că a = (modulo fc+ ) dacă și numai dacă xi = (modulo k), deci obținem cel mai bun potențial când Timod = Problema se rezumă la găsirea unei soluții relativ simple x + X = N, unde N este un număr mare de forma fc + Descompunând N în numere întregi complexe (întregi gaussieni), aflăm că o soluție există dacă și numai dacă fiecare factor prim N (dintre numerele întregi obișnuite) are forma fc + În conformitate cu binecunoscuta teoremă a lui Fermat, fiecare p prim de forma fc + poate fi scris, până la semnele lui u și v, într-un mod unic: p = u +v = (u+w)(u- iv), unde ѵ este par Numerele u și v pot fi calculate eficient prin rezolvarea ecuației x = - (mod p) și apoi calculând u + iv - gcd(x + i, p) folosind algoritmul euclidian pentru numere întregi complexe (întregi gaussieni) [Se poate lua x = n^p ^ modp pentru aproape jumătate din întregul n Această aplicare a algoritmului lui Euclid este în esență aceeași cu găsirea celei mai mici valori non-nule u + v astfel încât u±xv = ( modulo p ) Semnificațiile lui u și v apar și atunci când algoritmul lui Euclid pentru numere întregi este aplicat în mod obișnuit la p și x; vezi J A Serret şi C Hermite (J de Math Pures et AppL ( ), - ) ] Dacă factorizarea prime a lui N are forma ' reg = (ui+wi)' (ui -Wi)ei (ur+ivr)er (ur -ivr)er, atunci obținem T soluții diferite x + x% = N, xi L X , хі este par, setarea |m I + r|ісі | = (ui+wi)ei (u ±iV )e (ur±ît)r)'r Toate aceste soluții pot fi obținute într-un mod similar Cometariu O procedură similară poate fi utilizată atunci când mn = e, dar aceasta va necesita de cinci ori mai multă muncă, deoarece informațiile trebuie stocate până când se găsește o soluție cu xi = (modulo ) De exemplu, când mp = IO , obținem [t/'Uz] = și = • = ( + r)( - r)( + r) x ( -r) Dintre soluţiile |m I + r|o?i| = ( + r)( + r) și ( + r)( - r) primul dă |mі| = (nu este bun) și al doilea - |(r)i| \u d , |m I \u d (acest lucru este potrivit) Linia de la masă a fost obținut când punem xi = , x = - Rândul al tabelului a fost obținut după cum urmează [ />/ J = ; спустимся вниз к N = , равному - - , и получим четыре решения: N = + = + = + = + Соответствующими множителями будут , , и Проверим также /V - , dar acest număr nu este potrivit pentru că nu este divizibil cu Pe de altă parte, un număr prim /V - = + duce la un factor de În mod similar, obținem factori suplimentari pentru ,/V - , Lg - , N - , etc Factorul de rând este cel mai bun dintre primii șaisprezece factori găsiți folosind această procedură; acesta este unul dintre cei patru factori pentru N - Uj' -Uj' = Uj -Uj + qi(Ui -Uj) + Y kjtj qiqk(Ui ■ Uk) Este luată a doua derivată parțială în raport cu qk din partea stângă a lui ( ) Dacă se atinge minimul, atunci derivata parțială trebuie să dispară un = , ' = irațional, 'u - ' = După aplicarea algoritmului lui Euclid de trei ori, obținem vț = + Apoi, după efectuarea pasului S , obținem / - U= - \ - - /- V=- \ - DESPRE - Rezultatul transformării (/, , , ) = ( ,*, , ), ( , - , *, ), ( , , ,*), ( , * , , ) va - - - /- u= - \ - - - /- V=- \ - Z = ( ) DESPRE DESPRE Astfel, pz - u / b, așa cum se știe deja din exercițiu Cel mai mare q realizabil din ( ) minus cel mai mic posibil plus este egal cu |"i | + • • • + |utI - , " > , out > și m Această valoare este atinsă dacă și numai dacă există o soluție m - ui - u - u = xiui + X U + xsiz + W I" I, unde (xi, X , x , Xi) sunt numere întregi nenegative Poate fi adevărat că această limită este întotdeauna realizabilă atunci când suma |"i| + • ■ ■ + |ut| minim, dar nu pare evident ] Este suficient să găsim toate soluțiile ( ) care au un minim |uі| + ■ • • + |u(|, și scădeți dacă oricare dintre aceste soluții are componente cu semnul opus În loc de o formă pătratică definită pozitivă, vom folosi o funcție similară într-un anumit sens cu aceasta, (/(хі, ,xt) = |хі( і + • • • + Ж(( (|), definind |У| = Ij /іI + • • • + \yt| Inegalitatea ( ) poate fi înlocuită cu inegalitatea |m*,| t la pasul S și Y • Y Înlocuiește u} cu trunc( uj) , dar nu vom face nimic dacă p(u>) = pentru tot j" (Această operație elimină în esență un bit de informații din (u, , u() ) Dacă (u], , u]) și (u'/, , u") sunt doi vectori din aceeași clasă care au aceeași trunchiere p-fold, atunci spunem că sunt similare; în acest caz, inegalitatea p(u[ - u") p(u't - u'/) • • • > U() [suma peste toate soluțiile nenule ( )] + y r(ui > ■ • ■, ut) [suma peste toate soluțiile nenule (ui, , ut)] Din exercițiul , dacă punem d = , rezultă că ultima sumă va avea ordinul O(logm)( Cu suma rezultată se va proceda ca în exercițiul Să considerăm mărimea A(a) = ^r(u, , ut), unde însumarea se realizează peste soluții nenule ( ) Deoarece m este prim, fiecare (ui, ,ut) poate fi o soluție pentru ( ) pentru cel mult t - valori ale lui a Prin urmare, Z)o y/bv, deci v > k > Mai întâi minimizăm q\aq - mp\ pentru |aqn i - mpn-i|; deci q\aq - mp| > qq', unde A/m A/(m m) ) Presupunerea echivalentă este că tot m mare poate fi scris ca m = Kn(ai, , an) pentru unele n și unele ai ∈ { , , } Pentru un n n fix, numerele A'n(aj, ,an) au o valoare medie de ordin ( -y/ )n, iar standardul lor abaterea este de ordinul ( )"; deci ipoteza este adevărată aproape peste tot T W Cusick a făcut unele progrese cu privire la această problemă în Mathematika ( ), - iar cele mai mari mj care necesită a = sunt , , și Cel puțin autorul a găsit o reprezentare cu un r mr/k [mr/k] k[m/k\ [cf D E Knuth, The Stanford GraphBase (New York: ACM Press, ), ] Pe de altă parte, dacă a fost folosită o secvență congruentă liniară, atunci fc și modulo m trebuie să fie numere coprime, în caz contrar numerele au o perioadă foarte scurtă, după cum urmează din secțiunea De exemplu, dacă k = și m este par, cele mai bune numere sunt și , care se repetă alternativ Metoda este mai slabă ( ) în aproape toate cazurile, așa că nu o recomandăm Din păcate, însă, operația "himult" din ( ) lipsește în multe limbi de nivel înalt (vezi exercițiul - ) Diviziunea t/k este poate cea mai bună atunci când "himult" este absent max( ¥i, Ar) x dacă și numai dacă Xi > x și Xi > x Probabilitatea ca două evenimente independente să apară în același timp este egală cu produsul probabilităților acestor evenimente Obținem variabile aleatoare independente distribuite uniform Ui și ( r Punem X - u Dacă Ui > p, punem X - max(X, ( ), unde Ui este a treia variabilă uniform distribuită Dacă Ui > p + q , puneți și X - max(X, Ui), unde Ui este a patra variabilă aleatoare distribuită uniform Această metodă poate fi generalizată într-un mod evident pentru orice variabilă aleatoare cu funcție de distribuție polinomială Orez A- "Zona de acceptare" pentru algoritmul de la ex Cercul U +V = diviziune, și chiar cu o funcție de distribuție care poate fi reprezentată ca o serie de puteri (cum se arată, de exemplu, în algoritmul S, care utilizează minimizarea în loc de maximizare) De asemenea, putem proceda astfel (sugestie de M D McLaren (M D Mac-Laren)): dacă Ui ch- l/(e( -' )/ ° - ) pentru Deoarece G(x) = f*g(t)dt = -e-^ - ^ , variabila aleatoare X densitatea q poate fi calculată punând Astfel, se va obține o metodă rezonabilă de respingere dacă X este acceptat cu probabilitatea f(X')/cg(X) = /X Egalitatea f'(x) = xf(x) - este adevărată, deoarece f(x) = x~x - e ^ dt/t pentru x > Fie x = aj-i și y = x + n , atunci /ѵ°° e ( / dt = \fîȚne~x / f(y) aj Luați bj = pj-, luați în considerare acum problema cu pj = pentru fiecare j În notația matriceală, dacă Y = AX, unde A = (ay), este necesar ca AAT - C = (c, j) să fie satisfăcut (În altă notație, dacă Yj = "^ajkXk, valoarea medie a lui YiYj este ^a^a^/) Dacă această ecuație matriceală poate fi rezolvată pentru A, atunci poate fi rezolvată și atunci când A este o matrice triunghiulară, deoarece A = BU pentru o matrice ortogonală U și o matrice triunghiulară B și BBT = C Soluția necesară sub forma unei matrice triunghiulare poate fi obținută prin rezolvarea ecuațiilor + O O \u d c z, secvențial FOR Ots, , , , etc [Notă: Matricea de covarianță trebuie să fie determinată nenegativ, deoarece valoarea medie a mărimii (/s^yjYj) este egală cu suma Zc"j, care trebuie să fie nenegativă, și a soluția există întotdeauna atunci când C este definit nenegativ, deoarece C = U~ diag(Ai, , Xn)U, unde valorile proprii ale lui Xj sunt nenegative și U~ diag(UL?, , i/X//)U este soluția ] F(x/c), dacă c > ; funcție de treaptă [x > ] dacă c = sau - F(x/c) dacă c , unde C = oe/(o + e) O variabilă aleatoare cu o densitate q poate fi obținută cu ușurință ca un amestec de distribuții Gi(x) = xa pentru G [Inițializare ] Atribuiți ph - e/(a + e) (Aceasta este probabilitatea ca distribuția Gi să fie utilizată ) G [Generează variabile aleatoare cu distribuția G ] Generați variabile aleatoare independente distribuite uniform U și V, unde V Dacă U q, reveniți la pasul G | Numărul mediu de iterații este c - (a + e)/(eT(a + )) (b) G(z) = pz/{ - ( - p)z) (c) Media este /p, abaterea standard este y/ - p/p Pentru calcule suplimentare, rețineți că dacă H(z) = q + ( - q)z, atunci H'(l) = - q și R"( ) + R'( ) ~ = g(l - q ) , De aceea media și varianța lui /H(z) sunt egale cu q - și, respectiv, q(q - ), (a se vedea secțiunea ) În acest caz q = /p, factorul suplimentar z în numitorul G(z) adaugă la medie Atribuiți N - V ~ , unde N\ și N sunt variabile aleatoare independente, având o distribuţie geometrică cu parametrul p (Luați în considerare funcția de generare ) Atribuiți N - Ni + ■ ■ ■ + Nt - t, unde Nj (independent - Notă, n red ) - variabile aleatoare având distribuție geometrică cu parametrul p (Acesta este numărul de eșecuri înainte de cel de-al treilea succes, când se efectuează o secvență de încercări independente, fiecare dintre ele conducând la un succes cu probabilitatea p ) Pentru t = p = I și, în general, când valoarea medie (adică t(l - p)/p) a distribuției este mică, se poate simplifica calculul probabilităților pn = (t ^ + n)pf (l - P)n succesiv pentru n = , , , așa cum se arată în următorul algoritm VI [Inițializare] Atribuiți N - , q - p*, r - q și generați o variabilă aleatoare distribuită uniform U (Va rula q = Pn și r = p + ■ ■ ■ + pn pe tot parcursul algoritmului, rulând care se va opri imediat ce obținem U r, atribuiți N - W+ , q - g(l - p)(t - + N)/N, r - r + q și repetați acest pas În caz contrar, întoarceți N și terminați | [O metodă interesantă pentru distribuția binomială negativă cu o valoare reală arbitrar mare a t a fost sugerată de R Leger Mai întâi, generați o variabilă aleatoare X cu o distribuție gamma de ordinul t și apoi setați N egal cu o variabilă aleatoare cu o distribuție Poisson cu o medie egală cu X( - p)/p ] RI = + ( - A/R)-R Când pasul R este finalizat, algoritmul se termină cu probabilitatea I/R-, când pasul R este finalizat, trecerea la pasul R are loc cu probabilitatea E/R Următoarele sunt adevărate R R/AR/AR/AR/A R R/A R/A R R/AR/A - I/A R R/AR/A - I /A R/A - E/AR/A - I/A - E/A R = ѵ^ ё " , ; A = y/^/ a , Deoarece Y și Va - bu du = (a - bu) ^ (|(a - bu) - %)/b , obţinem I = fg^uVa - budu = ±a / /b , unde a = ( + Inc) şi b = c Când c = e ,/ , iau valoarea maximă |^/ /e a , În cele din urmă, pentru a calcula E, avem nevoie de următoarele formule de integrare: fVbu-au du = jb a~ / arcsin( ua/ - ) + jba- Vbu-ău ( ua/b-l), JVbu+au du = - ^b a~ ^ ln(Vbu-t-au + uVa-ib/ Vă)-i-jba~ Vbu+au ( ua/b+l), unde a, b > Fie ca verificarea 'X > e* /( - m) să fie efectuată la pasul R , atunci regiunea exterioară va cădea în partea superioară a dreptunghiului când u = r(a;) = (ex - Ve x - ex )/ ex (r(x) presupune aleatoriu o valoare maximă în punctul x = / , la care r(x) nu este diferențiabil!) , unde b = e* și a = m E ia o valoare maximă în apropierea punctului x = - , unde este aproximativ egală cu E a (Rezolvare de G Marsaglia ) Se consideră "distribuția Poisson continuă" definită astfel: G(t) = e tiI dt/r(a:) pentru x > Dacă X are această distribuție, atunci [ ¥] are o distribuție Poisson deoarece G(x + ) - G(x) = e M/F/T! Dacă q este mare, G este aproximativ normal În consecință, G^ -'(Fm(t)) este aproximativ liniară când FM(z) este funcția de distribuție a unei variabile aleatoare normale cu media și varianța egale cu g, adică E^(x) = F((x) - e)D// ), unde F(x) este funcția de distribuție normală ( ) Fie g(x) o funcție cu adevărat calculabilă astfel încât |G^ ^(Fm(t)) - g(t)| e, obținem N la ieșire, altfel rezultatul va fi M-[G(- J(F(X)) •'"I-MShch + I-,)' întrucât LGI (G)J este o mărime care are o distribuție binomială cu parametrii (t,p) și G este aproximativ normal [Cm Vezi și metoda alternativă propusă de Ahrens și Dieter (Ahrens și Dieter, Computing ( ), - ) ] Da A doua metodă oferă distribuția |cos |, unde Ѳ este o variabilă aleatoare uniform distribuită între și m/ (Se presupune că U = rcos , V - g sin b ) L = ( ) De obicei, reprezentarea binară se formează folosind pentru V și pentru L de la stânga la dreapta, apoi adăugând Această metodă [vezi (K D Tocher) K D Tocher, J Roy stat soc B ( ), ] poate duce la generarea eficientă de cifre binare independente cu o probabilitate p dată și poate fi folosită și pentru a genera variabile aleatoare cu distribuții geometrice și binomiale (a) Corect: (b) Fals, deoarece dacă pz ^ , M - Nz poate fi negativ Fie reprezentarea binară a lui p să aibă forma ( bіb- )r Continuăm în conformitate cu următoarele reguli VI [Inițializare] Atribuiți m ( - ez ^ k) \u d - e- - En > (-z) "/ (n! ( " - )) și \u d + E C) Um \u d + \u d 'gn + d + I + / o (n) + (n ) K > în notația ex - ] Generam un punct aleator (yx, -, yn) pe sfera unitatii si presupunem ca p - іuі {ух/р, , Ун/р)', in alte cazuri incepem de la inceput Aici K = rxn{(^ayu )n+i/{^a Yk) | "/Cui = } = o"- , dacă ap > ax " {{n + )/(ai + ap))n+ (aiap/n)n - în alte cazuri Să presupunem că Xn+x = , apoi atribuiți Xk este satisfăcut La ieșire obținem {Xj,Yj) = f{Zj ) pentru și fi > astfel încât (a- + a )/\/ = și + |/ - = , deoarece numerele Xn cresc exponențial în n conform proprietăţile relaţiilor liniare recurente Dacă abandonăm forma recurenței liniare, să zicem, folosind recurența Xn = Xn- cos#n + Xn-ss sin#n, unde jn este ales uniform în [ m), se poate obține un rezultat potrivit, dar trebuie să faci mult mai mult calcul (c) Începeți cu probabil de variabile aleatoare normale Xo, • ■ •, Xs, Vo, • • , Y După ce ați folosit aproximativ / dintre ele, generați alte de variabile aleatoare, după cum urmează Alegeți numerele întregi a, b, c și d independent în [ ), unde a și c trebuie să fie neclare Apoi atribuiți Xj X(aj ț b) mod CO(r) "b Vfcj-fd) mod (r)I^ #, X(aj^-b) mod sin # + I (cj-fd) mod COS Ѳ pentru I și I sin ѲI > de variabile aleatoare noi le vor înlocui pe cele vechi Rețineți că pentru a obține o nouă variabilă aleatoare, trebuie să efectuați doar câteva operații Această metodă nu diverge ca șirurile conținute în (b), deoarece suma pătratelor t)(X + Y ) = t)((X]) + (Yj) ) rămâne constantă cu valoarea S " , cu excepția unei erori minore de rotunjire Pe de altă parte, constanța lui S este de fapt un dezavantaj al metodei, deoarece suma pătratelor trebuie să aibă într-adevăr o distribuție ^ cu grade de libertate Pentru a depăși problema care a apărut, ar fi necesar să se utilizeze nu variabile aleatoare normale Xj, ci aXj, unde a = |(Vio + n/ ) /S este un factor de normalizare precalculat (Valoarea |(Vios + \/ ) va aproxima în mod rezonabil variabila aleatoare x necesară ) Literatură C S Wallace, ACM Trans op Math Software ( ), - ; R P Brent, Lectore Note în Comp sci ( ), - (a) Transformarea (X',Y') = f(X,Y) este o corespondență unu-la-unu cu transformarea mulțimii {x, y > } în sine astfel încât x' + y = x + y și dx 'dy' = dxdy obține x^Y' = (xTr-Ă)"od ' xTr = (nr + Ă)"dL (b) Această transformare este o potrivire doi la unu, astfel încât x' + y' = x + y și dx dy' = dx dy (c) Este suficient să luăm în considerare transformarea "j-transpusă" X' = ( Xj+ Xj + iXjyj-iyj- yj- • • • )r, Y' - ( yj+ yj+iyjXj-iXj- Xj- ) pentru numere întregi fixe j și apoi compuneți transpunerile J pentru j = , , - , , - , În timp ce distribuțiile comune de probabilitate ale lui X' și Y' converg la |J| -> oo Fiecare transpunere J este unu-la-unu cu operațiile x' + y' = x + y și dx' dy' - dx dy Utilizați Ui ca valoare inițială pentru alți generatori de numere aleatoare (este posibil un generator congruențial liniar cu un multiplicator diferit); luați unul dintre Ui, U , ca multiplicator SECȚIUNEA Există modalități de a selecta n - m înregistrări din ultimele N - t și modalități de a selecta n - m - înregistrări din V - f - după selectarea (t + )-a înregistrare Trecerea de la pasul S la pasul S nu este posibilă dacă numărul de înregistrări rămase de verificat este n - adică Să nu confundăm probabilitățile condiționate și necondiționate Valoarea lui m depinde de alegerea aleatorie a primelor t elemente Dacă luăm media tuturor opțiunilor posibile care pot apărea printre aceste elemente, constatăm că (n - m)/(Am - t) are o medie exact n/N De exemplu, luați în considerare al doilea element Dacă primul element este selectat în eșantion (acest lucru se întâmplă cu o probabilitate de n / N), atunci al doilea element este selectat cu o probabilitate de (n - ) / (N - ); dacă primul element nu este ales, atunci al doilea este ales cu probabilitatea n/(N - ) Probabilitatea totală de a alege al doilea element este (n//V)((n - )/(W - )) -I- ( - n//V)(n/(W - )) = n /N Din algoritm rezultă că h n - m\ , , n - (m - ) , P(m,t + ) = ^ - - - Jp(m,t) + -N t Formula necesară poate fi demonstrată prin inducție pe t, în special p(n, JV) = În notația ex probabilitatea ca t = k, după sfârșitul algoritmului să fie egală cu qk = p(n,k) -p(n,k - ) = (*Zj)/(*) Media este X, k \u d okChk \u d (N + ) p / (ti + ) - La fel ca în ex , se obține ^,k= fc(fc + l)gk = (N + )(W + l)n/(n + ); varianța este deci (Am + )(N - n)n/(n + )(n + I) Să presupunem că există o alegere Pr(X > k) Apoi atribuiți X - , p / Putem presupune că n/N fc) = P'=o PgSul,-; > k) = (N~jk)/(N - J) (Această metodă este bună dacă, de exemplu, n + ) P oa n • ■ • O(x + ii) mod n- Prin urmare, subsecvențe (r) | inchis [Câteva trucuri magice se bazează pe faptul că cele trei tăieturi și amestecări nu sunt deloc aleatorii; vezi Martin Gardner, Mathematical Magic Show (Knopf, ), cap ] Atribuiți Yj t - n, atribuiți Xj j (se poate folosi tabelul de identificare a algoritmului), atribuiți Xj j și Xi j pentru oo, aceasta din urmă este o secvență monotonă mărginită de , deci converge și La Pito (n) pentru unele j > ) > Pr(Sj(n)) ;=i pentru toți k Ca contraexemplu care arată că egalitatea nu va fi întotdeauna adevărată, nu este greu de aranjat că S'j(n) va fi întotdeauna adevărat pentru unele j, dar Pr(Sj(n)) = pentru toate j Fie pj = Sj>iPr( (r)) Rezultatul exercițiului anterior poate fi generalizat astfel: Pr(Sj(n) zile ale unor j > ) > Pr(Sj(n)) Pentru -orice enunțuri disjunctive Sj(n) Deci obținem = și, în consecință, Pr(Si,(n') pentru unele j > ) = Pi Setăm e > ; să fiu suficient de mare încât Pi > ~ €-Let 'A(λ) = (numărul n )/N Este evident că φi(n) m( V) ) ) = рі și rezultatul dorit se obține pentru i = Din simetria ipotezelor rezultă că este valabil pentru orice valoare a lui i Adăugați probabilitățile pentru j, j + d, j + d, , m + j - d în definiția lui E limsupn too(an + bn) oo iar acest lucru se poate întâmpla numai atunci când fiecare (yjn - a) tinde spre zero În estimarea sumei în egalitate ( ) -(U n} fc-distribuit dacă (Un) ( , fc - )-distribuit Se aplică teorema Вс /(ті, ,хЦ) = [w oo, trebuie să obținem f(n) -> oo Prin urmare, "fc(n)/n = (da(/(p))//(n)) • (/(n)/p(/(n))) ->pfc/p = p( -p)fc [Aici este folosit doar faptul că secvența este (fc + )-distribuită ] Fie pk = Pr(Un este începutul unei serii de lungime fc) = Px(Un - > Un Unj-k} Z/fc + \/fc + l\ fc + \ fc + \ X (fc + )! \\ D / X JX ) + ) la fc + - (fc + )! "(fc + )! (vezi ynp - ) Acum vom proceda ca în exercițiul anterior pentru a transforma această expresie în Pr(/(n) - /(n - ) = fc) [Numai trebuie să presupunem că secvența este (fc + )-distribuită ] Fie pentru s, t > Pst = Pr(Ap- *- "An - t" ^ An- t-l ^ • • • ^ An- și Xn = * • • =Xn+s ^Xn-hs-hl) "-s- t- , pentru t > fie qt = Pr(Xn- t- = Xn- t-i / Xn-i) = Q Pst = | • s Să facem ca în ex (Soluție de R P Stanley ) Ori de câte ori o subsecvență S = (b - ), (b - ), , {b - ), (b - ), setul de cupoane trebuie să se termine în dreapta partea lui S, deoarece un set de cupoane se află în întregime în prima jumătate a lui S Calculați probabilitatea ca setul de cupoane să înceapă la poziția n folosind probabilitatea ca ultima apariție anterioară a lui S să fi avut loc în poziția n - , n - etc , ca în ex Procedați ca în demonstrația teoremei A pentru a calcula Pr și Pr (Decizia lui T Herzog (T Herzog) ) Da De exemplu, utilizați ex la secvența ([/[n/ ]) când {Un} satisface definiția lui R (sau chiar versiunea sa slabă) (a) și | (Când n crește, împărțiți IrJ' la jumătate) (b) Fiecare punct nou împarte un interval în două părți Să spunem că r este max^((n + fc)O Atunci = / In + O(l/m) (c) Pentru a testa indicația, să presupunem că este selectată din intervalul cu punctele finale Um și Umi și puneți a*, = max(m - n, mn' - n, ) Atunci, dacă p = min^n=n+i mZ^m), = p/(n + ak) > p^=i /(n + k); prin urmare, p lg n^î)> deci KaK (n + )-al-lea punct împarte întotdeauna cel mai mare interval în intervale de lungime lg și lg "+ [Indagationes Math ( ), - ] (a) Nu! Se obține Pr(U'n limsupn +oo r'(|' n /, ])/|' n /, = - \/ și Pr( Vn r deci er poate fi făcut arbitrar mic Prin urmare, limita este a( , , ) = / •■■ / f(xi, ,Xk) dxi dxk jo jo și ( ) este valabil pentru toate funcțiile suficient de fluide f Rămâne de demonstrat că funcția din ( ) poate fi aproximată prin funcții netede cu orice precizie necesară (a) Urmează imediat din Ex (b) Utilizați transformata Fourier discretă într-un mod similar; vezi D E Knuth, AMM ( ), - (a) Fie c orice număr întreg diferit de zero Să arătăm conform ex că N~ - V' e 'r, cL'n -> ca N -> oo = Acest lucru este adevărat deoarece dacă K este orice număr întreg pozitiv, atunci obținem N n= K N n= *= - K N e rricUn + k n= fc= e K N(r) e LA' (b) Când d = , atunci din ex rezultă că ((adi + oo) mod ) este echidistribuită dacă și numai dacă ai este un număr irațional Pentru d > , se poate folosi (a) și inducția pe d [Act Math ( ), - Rezultatul din (b) a fost obţinut anterior printr-o metodă mai complicată de H Weyl (Nachr Gesellschaft der Wiss Gdttingen, Math -Phys Kl ( ), - ) Cu ajutorul unor argumente similare, se demonstrează că o secvență polinomială este echidistribuită dacă cel puțin unul dintre coeficienții aa, • ■ •, oi este un număr irațional ] Dacă șirul este echidistribuit, atunci numitorul din Corolarul S se apropie și numărătorul se apropie de valoarea obținută în acest exercițiu Vezi Math Comp ( ), - [Luați în considerare și următorul exemplu al lui A J Theremin (A G Waterman): fie ( n) o [ ^-secvență echidistribuită și (An) o secvență binară oo-distribuită Fie Vp = sau - , respectiv, când Xn este sau Atunci (Vn) este echidistribuit și alb, cu toate acestea, Pr(Vp = Vp+i) = | Fie Wn = (Vp - en) mod , unde (en) este orice succesiune care descrește monoton către , atunci (IVP) este echidistribuită și albă, dar Pg(IVp (n) + ••■ + t> "o(n)) ^X(r(x) -s((r)) )i/f (n) + O(t) , unde х = хі Х іс conține r(x) zerouri la pozițiile impare și s(x) zerouri la pozițiile pare Conform distribuției ( &), valoarea dintre paranteze tinde spre fc( fc )/ lr = k/ Suma rămasă este evident maximă dacă ux(n) = ux(n) când r(x) > s(x) și ux(n) = când r(x) , și găsiți un No astfel încât inegalitatea N > No implică ambele inegalități \i/r(N)/N - p| Ni rezultă că în este egal cu hm sau sm pentru unele M > Nu Din N > Ni rezultă că vr(Nr) + ^(Nr) VrtNr) - pNr + HS( VS) - pNs v N P N p Nr+Ns De exemplu, dacă reprezentarea binară a lui t este ( O - " " afc ) , unde " °" denotă o succesiune de zerouri Fie regula să accepte Un dacă și numai dacă [N P-kJ - ai, • ■ ■, [N n-i] = ak Fie ao = bo și am+i = max{s*, | , înlocuiți Un cu |([/n + tna ) (b) Există un indice i astfel încât c; c], să spunem c = și c[ = Atunci există un indice j astfel încât c = Pentru orice set fix de k - rânduri din matricea B, al cărui număr nu este egal cu i sau j, obținem (сВ,с'В) = (d, d') dacă și numai dacă rândurile i și j au parțiale valori (acest lucru se întâmplă cu o probabilitate de / (c) În notația algoritmului L, luăm n = * - și Xc = (-l)G(cB + ei\ ATUNCI p = și a = - s cu atât este mai mare probabilitatea ca (X - pr) > n p Conform (a) aceasta nu este mai mare decât a /(pr ) Concluzia pentru un M fix nu prezintă interes, deoarece, evident, există un algoritm pentru găsirea factorilor oricărui M fix (adică un algoritm pentru găsirea factorilor) Teoria este aplicabilă tuturor algoritmilor care au timpi de calcul scurti, nu doar algoritmilor care găsesc factorii eficient Dacă fiecare schimbare a unui număr dintr-un tabel aleator duce la un tabel aleatoriu, atunci toate mesele sunt aleatorii (sau nu există niciunul) Dacă nu permitem grade de aleatorie, atunci răspunsul trebuie să fie "Nu întotdeauna" SECȚIUNEA RANDI STJ F Celulă de ieșire de memorie STA F Stochează valoarea k LDA XRAND GAH-X MUL F gAX h-aX INCX rX h - (aX + s) mod t JOV *+l Asigurați-vă că overflow este dezactivat SLAX ga h - (aX + c) mod t STA XRAND Memorie X MUL F g A H- [fcX/mJ INCA Adăugați la n (modulo și z + z + ) implică faptul că /i( ) - n = h(s') - n' (modulo - ) Deoarece |h(e) - h(s')| > [Această metodă de inițializare este inspirată din comentariile lui R P Brent (R P Brent, Proc Australian Supercomputer Conf ( ), - ), deși algoritmul lui Brent este complet diferit de acesta În general, dacă întârzierea k > I, dacă f - cu ( - este valabil doar dacă {s, s'} - { , e - } ] Următoarele operațiuni se referă la limbajul simplificat subsetul FORTRAN, așa cum este definit de Institutul Național American de Standarde, cu excepția utilizării instrucțiunii PARAMETER pentru comoditate SUBRUTINĂ RARNRY(AA N) ÎNTREG IMPLICIT (AZ) DIMENSIUNEA AA(*) PARAMETRI (KK= ) PARAMETRI (LL= ) PARAMETRI (MM= ** ) COMUN /RSTATE/ RANX(KK) SAVE /RSTATE/ DO J= ,KK AA(J)=RANX(J) DO J=KK+ ,N AA(J)=AA(J-KK)-AA(J-LL) DACĂ (AA(J) LT ) AA(J)=AA(J)+MM CONTINUA DO J= ,LL RANX(J)=AA(N+J-KK)-AA(N+J-LL) DACĂ (RANX(J) LT ) RANX(J)=RANX(J)+MM CONTINUA DO J=LL+ ,KK RANX(J)=AA(N+J-KK)-RANX(J-LL) DACĂ (RANX(J) LT ) RANX(J)=RANX(J)+MM CONTINUA Sfârşit SUBRUTINĂ RSTRT(SEED) ÎNTREG IMPLICIT (AZ) PARAMETRI (KK= ) PARAMETRI (LL= ) PARAMETRI (MM= ** ) PARAMETRI (TT= ) PARAMETRI (KKK=KK+KK- ) DIMENSIUNEA X(KKK) COMUN /RSTATE/ RANX(KK) SALVAȚI /RSTATE/ DACĂ (SĂMÂNȚĂ LT ) ATUNCI SSEED=MM- -MOD(- -SEED,MM) ALTE SSEED=MOD(SEED,MM) TERMINAT DACA SS=SSEED-MOD(SSEED, )+ DO J= ,KK X(J)=SS SS=SS+SS DACĂ (SS GE MM) SS=SS-MM+ CONTINUAȚI FACEȚI J=KK+ ,KKK X(J)=OX( )=X( )+ SS=SSEED T=TT- DO J=KK, ,- X(J+J- )=X(J) DO J=KKK,KK-LL+l,- X(KKK-J+ )=X(J)-M D(X(J), ) DO J=KKK,KK+ ,- IF (M D(X(J), ) EQ ) ATUNCI X(J-(KK-LL))=X(J-(KK-LL))-X(J) DACA (X(J-(KK-LL)) LT ) X(J- (KK-LL))=X(J-(KK-LL))+MM X(J-KK)=X(J-KK)-X(J) IF (X(J-KK) LT ) X(J-KK)=X(J-KK)+MM END IF CONTINUĂ DACĂ (M D(SS, ) EQ ) ATUNCI FĂ J=KK, ,- X(J+ )=X(J) X( )=X(KK+ ) DACA (MOD(X(KK+ ), ) EQ ) ATUNCI X(LL+ )=X (LL+ )-X(KK+ ) IF (X(LL+ ) LT ) X(LL+ )=X(LL+ )+MM END IF END IF (SS NE ) ATUNCI SS=SS/ ELSE T=T- TERMINAT DACĂ DACĂ (T GT ) MERGE LA DO J= ,LL RANX(J+KK-LL)=X(J) DO J=LL+ ,KK RANX(J-LL)=X(J) END Aritmetica în virgulă mobilă pe operanzi pe de biți este conformă cu standardul ANSI/IEEE și permite ca Un = ( Un-ioo - Un- ) mod să fie calculat cu o precizie excelentă pentru fracțiile [/" care sunt multipli întregi ~ Cu toate acestea, următorul program folosește recurența aditivă Un = (L'n- + Un- ) mod pentru multipli întregi de - , deoarece calculatoarele cu pipeline pot scădea partea întreagă mai repede decât efectuarea unui salt condiționat pe semn a rezultatului intermediar Teoria din ex se aplică și acestei secvențe valoare Principala idee nouă a programului ranfstart este de a păstra o copie a i cifrele binare cele mai puțin semnificative ale fracțiilor în și Traducere în limbajul de programare FORTRAN, similar cu operațiunile din ex generează aceleași numere ca un program C #define QC /* întârziere lungă */ #define LL /* scurtă întârziere */ #define mod sum(x,y) (((x)+(y))-(int)((x)+(y))) /* (x+y) mod */ dublu ran u[KK]; /* starea generatorului */ void ranf array(double aa[],int n) { /* aa atribuiți n aleatoriu fracții */ înregistrare int i,j; pentru (j= ; j = , ) ss-=l, - *ulp; /* deplasare ciclică de de biți ♦/ } pentru (;j ;j-) ul [j+j]=ul[j] ,u[j+j] =u[j] ; /♦ "pătrat" */ pentru (j=KK+KK- ;j>KK -LL;j-= ) ul[KK+KK- -j]= , ,u[KK+KK- -j]=u[j]-ul[j]; pentru (j=KK+KK- ; j>=KK; j-) dacă(ul[j]) { ul[ j-(KK-LL)]=ulp-ul [ j-(KK-LL)], u[j-(KK-LL)]=mod sum(u[j-(KK-LL)] ,u[ j]); ul[j-KK]=ulp-ul[j-KK] ,u [j-KK]=mod sum(u[j-KK] ,u[j]); } if (este impar(e)) { /* "înmulțire cu z" */ pentru (j=KK;j>O;j-) ul[j] =ul[j- ] ,u[j] =u[j- ] ; ul[ ]=ul[KK] ,u[ ]=u[KK]; /* rotiți tamponul */ if (ul[KK]) ul[LL] =ulp-ul[LL] ,u[LL] =mod sum(u[LL] ,u[KK] ); } dacă (s) s"=l; altfel t-; } pentru (j= ; j În mod similar, Xn+ oo = Xn A Xn+ + Xn+ Prin urmare, Yn+ioo = Yn + Yn+ + Ki+ când n mod - hOO, de exemplu -Xn+ = Xn + Xn+ + Xn+ + An+ = Xn + Xn+ + -Vn+i + Xn+ + A\+ii Dacă toți indicii n + + , atunci obținem k termeni ai expresiei Yn + când n mod - - t pentru +i +-Xn+i + • • -+An+i = Aici Yn+io nu depinde de {Yn, , Yn + }- Cazul în care t = este interesant deoarece oferă de termeni ai relației Yn+ = Yn+i + Yn+ + ■··+Yn+ , care tind să devină zero în ciuda numărului mare membrii Acest lucru se datorează faptului că majoritatea de șiruri care au sau mai puține au aceeași paritate Când există un raport de k termeni, probabilitatea ca Yi + ioo = este pk - k \ (k \ ij Valoarea t ia valorile , , , , , , , , în timpul tipăririi biților Deci, am stabilit că numărul așteptat de unități tipărite este (r) ( r + Irz + r + Pre + Ire + r + r o + r + R + p + ree + / ) / nr numărul așteptat de imprimate = (r) ( °°)/ n , așteptat numărul de zerouri este nr Offset-ul observat dispare dacă mai multe elemente sunt aruncate De exemplu, dacă sunt folosite doar de elemente ale programului ar argau(a ), probabilitatea ar putea fi ( ps + pe + ryu + ■ • • )/ Lucrurile stau mai rău cu programul hap argg/(a, ): aici probabilitatea este ( p + pe + pe + • - • )/ , întrucât Xn+ oo = Xn + Xn+ -C cu programul ) recomandat în secțiunea, obținem probabilitatea ( pm + Yury + pir + • • ■ ) / , care poate fi găsită în cursul unor astfel de experimente dacă pragul pentru imprimare este ridicat de la la, să zicem, , dar apoi estimarea numărul de rezultate este de numai aproximativ , dintr-un milion de încercări [Acest exercițiu se bazează pe ideile lui Y Kurita, X Leeb și M Matsumoto (M Matsumoto), raportat autorului în ] Următorul program vă permite să obțineți noi numere întregi aleatoare, care sunt exprimate prin ran arr next(j), începând cu programul ranstart Sdefine QUALITY /* nivel de calitate recomandat pentru utilizare de înaltă performanță */ long ran arr buf [CALITATE]; lung ran arr sentinel=-l; lung *ran arr ptr=&ran arr sentinel; /* următoarea aleatorie număr sau - */ #define ran arr next() (*ran arr ptr>= ? *ran arr ptr++: ran arr cycleO) long ran arr cycle() ran array(ran arr buf CALITY); ran arr buf[ ]=-l; ran arr ptr=ran arr buf+l; returnează ran arr buf[ ]; } РАЗДЕЛ ( )- , ( ) , ( ) , •••, ( )- , ( )- , ( )- (а) -( ) , - ( ) , -( - ) - (b) ( ) - , ( )- ( ) (c) (І іі)з, ( Î Î )з, ( )з (d) -( , ) / , -( ) / О, ( ) / О ( ) і (a) Între rA și rX (b) Restul din registrul rX are un punct de separare între octeții și ; câtul din registrul rA are un punct de separare la un octet la dreapta cifrei celei mai puțin semnificative a registrului Reprezentarea în cod invers se obține scăzând din , = ₽ - , în loc de scădere din - ₽ (a, c) P - , -(r * - - ); (b) ₽ - , - P~ Reprezentarea complementului a doi pentru un număr negativ x poate fi obținută luând numărul + x (n este suficient de mare pentru ca numărul să fie pozitiv) și extinzându-l spre stânga cu un număr infinit de nouă Reprezentarea în cod invers poate fi obținută în mod obișnuit (Aceste două reprezentări sunt aceleași pentru zecimale infinite, altfel reprezentarea celor două este (a) și reprezentarea complementului a două este (a + ) ) Aceste reprezentări au sens dacă presupunem că valoarea sumei infinite N = + + + + ■ ■• este - , deoarece - ION = Vezi și ex , care se ocupă cu sistemele de numere p-adice Pentru numerele a căror reprezentare este finită în baza p, reprezentarea p-adică coincide cu reprezentarea complementului a doi considerată aici, dar nu există o legătură directă între câmpul numerelor p-adice și câmpul numerelor reale a b? = ^ j(akj+k-ibk~ + ■ • • + akj)bk^ O FAȚADA DE ADOB PRODUTĂ ȘTIINȚĂ [Notă Iată și alte "fraze numerice": FACEȚI UN DECEN; UN CAD A HRANIT UN BABE DE VITA, CACAO, CAFEA; BOB s-a confruntat cu un DODO MORT ] r , az, a , , Goî a- , a- , · , Az, A , Ai, Ao; A i, A , '[ , , , , ; - , - , ] = [ , , , !, Vo; !, і ]' dacă A = akj+i-haki+i- , ■ ■ ■ , k (Algoritmul descris mai jos efectuează atât adunarea, cât și scăderea, în funcție de alegerea semnului plus sau minus ) Mai întâi setat la а"+і а"+ "+і "+ ; atunci pentru m = , , , n + este adevărat: st t t lbm + k\ este stabilit; dacă st a*- fc este un punct limită al mulțimii {yi,yi, ■ ■ ■} aparținând lui S În conformitate cu răspunsul la ex toate numerele de forma (a + i)/ fc sunt reprezentabile dacă a și b sunt numere întregi Prin urmare, pentru x și y reale și k > , numărul Zk = (L *a:J + | fe/ji)/ fc pentru unele numere întregi mn și n aparține lui S + m + nі Se poate arăta că fiecare punct reprezentabil din afara lui S trebuie să aparțină mulțimii S + m + n, pentru (m, m) / ( , ) În consecință, dacă |хг| și |r/| sunt fixe și k este suficient de mare, obținem că Zk ∈ S și limfc-io Zk = x + yi aparține mulțimii S [ÎN Mandelbrot (V Mandelbrot) a numit setul S un dragon cu două capete, observând că este format în esență prin combinarea a doi "balauri strâmbi" (vezi cartea Fractals: Form, Chance, and Dimension (San Francisco: Freeman, ), - , în care Mandelbrot a afirmat că dimensiunea limită este lg x k, , , unde x = + x~ ~ , Alte proprietăți ale curbei dragonului sunt descrise în articolul lui C Davis și D E Knuth J Recr Matematică ( ), - , - Seturile S de baze { , } și alte baze complexe sunt construite și analizate de D Goffinet în AMM ( ), - ] În I Kâtai şi J Szabo, Acta Scient Matematică ( ), - , se arată că baza - d + i duce la sisteme numerice cu cifre { , , ,d } Alte proprietăți ale unor astfel de sisteme au fost investigate de WJ Gilbert în Canadian J Math ( ), - ; Matematică Magazine ( ), - V Norton a propus un alt sistem de numere interesant bazat pe + i cu numere { , r, - , - r} [Math Magazine ( ), - ] Pentru sistemele de numere bazate pe numere întregi mai generale, vezi I Kâtai și B Kovâcs, Acta Math Acad sci spânzurat ( ), - , - ; Acta ath spânzurat ( ), - ; A Petho, Studia Scient Matematică spânzurat ( ), - Dacă m > u sau m și aparține intervalului I există exact ~ seturi de decizie D în care |a| și n > , unde fie este sau Vezi Proc IEEE Symp Comp Arith ( ), - ; JACM ( ), - ] (a) III = Î = ^ = Î ^ ^ = •• = ^t III ••• are nouă reprezentări, (b) D este partea fracționară a pasului , care ia întotdeauna valori între - / și + / Fie x să aibă zece sau mai multe reprezentări D-zecimale Apoi, pentru k suficient de mare, cuvântul * r are zece reprezentări care diferă în cifre situate în stânga punctului zecimal: Având în vedere unicitatea reprezentării numerelor întregi, numerele rij sunt diferite, să zicem, nі , dar acest număr aparține intervalului /i - fio > > / - (- / ) Astfel, am ajuns la o contradicție, care demonstrează validitatea aserției, (c) Orice număr de forma O aur , unde orice aj este - sau , este egal cu a'ia' pentru a' = a} • + (mai mult, are încă reprezentări a! a! etc ) O astfel de reprezentare poate fi obținută folosind o metodă similară celei propuse în textul secțiunii pentru conversia într-un sistem de numere ternar echilibrat Spre deosebire de sistemele discutate în ex , zero poate fi reprezentat într-un număr infinit de moduri, care se obțin prin înmulțirea cu o putere de zece a sumei | + Ș fc> ( - |) • ~fc (sau din aceeași reprezentare, dar cu semne de cifre opuse) Reprezentările unităților sunt | - | , - | - I', - | + *, - - | - - - C + |* etc , unde ±|* = (± |)( + " + •••) [AMM ( ), - ] Presupunând că există o aproximare bn ■ ■ - bibo cu o eroare de * * - x > " , unde t > , vom arăta cum se reduce eroarea cu un factor de aproximativ t (Procesul poate fi pornit de la orice aproximare pentru care mare, astfel încât reprezentarea zecimală a numărului - ma are o unitate în poziția [P L Graham (RL Graham) a arătat că nu există un alt set de numere întregi care să satisfacă aceste proprietăți Andrew Odlyzko a dovedit că restricția în luarea în considerare a mulțimilor de numere întregi este inutilă în sensul că, dacă cele mai mici două elemente ale lui D sunt și , atunci toate cifrele trebuie să fie numere întregi Dovada Fie S = {SĂ, măsura m + e) P(xm + S) este pozitiv Atunci xm , atunci din faptul că (m - xm m - xm + ) r) S are măsură pozitivă, rezultă prin inducție că această măsură este egală cu și (m m + ) C xm + S, deoarece mulțimea S este închisă Pentru xm = și (m m + ) S Mb trebuie să obțină m si rezultatul dorit se obtine prin inductie, deoarece n/ are o reprezentare unica de acest tip Dacă n este impar, atunci eo = și problema se reduce la reprezentarea numărului -(n - )/ Dacă acesta din urmă este fie , fie , atunci evident că există o singură modalitate de a rezolva problema În caz contrar, se demonstrează prin inducție că numărul are o reprezentare unică [De aici rezultă că orice număr întreg pozitiv are exact două astfel de reprezentări cu ordine descrescătoare eo > ei > ••• > et: una cu t par, cealaltă cu tJ impar Dovada poate fi efectuată ca în Ex Rețineți că a + b este produsul dintre -i și un întreg complex dacă și numai dacă a + b este par Această reprezentare este implicit legată de "curba dragonului" descrisă în răspunsul la ex Este suficient să demonstrăm că orice colecție {To,Ti,Tz, } care satisface proprietatea B poate fi obținută prin "contractarea" unei colecții {So, Si, Sz, ■ }, unde So = { , , ,b - }, și că toate elementele mulțimilor Si, Sj, sunt multipli ai lui b Când demonstrăm ultima aserțiune, putem presupune că ∈ To și există cel puțin element b > astfel încât b ț To Demonstrăm prin inducție pe n că dacă nb £ To, atunci nb + , nb + , , nb + b - nu aparțin niciunei dintre mulțimile T,; dacă nb £ To, același lucru este valabil și pentru numerele nb - , , nb - b - Atunci colecția dorită va fi Si = {n I nb € To}, Sz = Ti, = Tr și așa mai departe, de unde urmează rezultatul Dacă n £ To, atunci n = to + T + • • •, unde ti, tz, sunt multipli ai lui b Prin urmare, to , altfel nb+b ar avea două reprezentări - - Prin inducție la mod b = k Din reprezentarea nb = (la - k) + ti + ■ ■ ■ rezultă la = nb -k [Cm Nieuw Archief voor Wiskunde ( ) ( ), - Rezultatul final este din R A MacMahon, Combinatory Analysis ( ), - ] (a) Fie Aj mulţimea numerelor n a căror reprezentare nu conţine bj; atunci, conform proprietății de unicitate, n ∈ A} dacă și numai dacă n -bj Aj Prin urmare, n € A} dacă și numai dacă n există exact m numere întregi care aparțin lui Aj dar nu lui Ak și exact m care nu aparțin nici lui Aj, nici lui Ak; prin urmare, w = bjbk- Prin urmare, bj și bk nu pot fi impare în același timp Cu toate acestea, unul dintre ele, desigur, este impar, deoarece numerele impare pot fi reprezentate în mod binar (b) Conform punctului (a), numerele b pot fi renumerotate în așa fel încât b să fie impar și bi, bz, sunt par Apoi seria |i>i, , • ar trebui să formeze și o bază și această procedură poate fi repetată (c) Dacă există o bază binară, atunci pentru a reprezenta numărul ± n (pentru n mare) pentru k suficient de mare, este necesar să se obțină atât dk pozitiv, cât și negativ Dovada afirmației inverse este dată în următorul algoritm [Setare inițială ] Setați la m, m + -> m + , m + -> m + , m + -> m - , rămâne doar să arătăm că algoritmul se termină la - - -> - -> -> -> -> -> și -> -> -> Astfel, = ■ ° - • + ■ - • - • - • + • Notă Alegerea do, di, dș, = , - , , , - , , oferă și o bază binară Pentru mai multe detalii despre această problemă, consultați Matematică Comp ( ), ; A D Sands, Acta Math Acad sci spânzurat ( ), - (Vezi exercițiile aferente - , - , - ) (a) Înmulțind numărătorul și numitorul cu o putere adecvată de , putem presupune că u = ( U Ui u ) și ѵ = ( V ViVo)s, unde vo = , sunt - numere întregi adic Pentru a determina w se poate recurge la următoarea metodă de calcul, folosind pentru întregul (un-i • • • " ) = și mod n notația u^ (n > ) Fie wo = io și = wo Pentru n = , , presupunem că am găsit un întreg wM = (wn-i wo) astfel încât u^ = (modulo Π) Atunci t/n+ ) = t/n+ (modul P) Prin urmare, putem pune wn = sau în funcție de ceea ce numărul (i/n+ ) - Dn+ Mn)) mod n+ este egal cu: zero sau n (b) Aflați cel mai mic număr întreg k astfel încât k = (modulo n + ) Atunci /( n + ) = m/( k - ) pentru un număr întreg m, p, atunci reprezentarea -adică a numărului ( A - ) / este un număr întreg (d) Pătratul oricărui număr de forma ( U U ) are forma ( )r, deci condiția enunțată este necesară Suficiența este dovedită prin prezența următoarei proceduri de calcul ѵ = y/n pentru cazul în care n mod = H [Setare inițială ] Setați m (m - ) / , k "- , Go ■ și S = {si, ,sr} avem £n(S) = (^JI^J {{tifc + ai, , ir + ar} I <J<b (ai, ,ar) {tl, ■ ■ ■ ,ir} G Kn l({(si + j - ai)/ I < i < r})}, unde uniunea interioară este o secvență completă de cifre (<ц, , аг) care satisface condiția a, = Si + j (modulo ) pentru < i < r De dragul unicității, vom necesită definirea indicilor în această formulă ti - t,< = (s, - ai)/b - (sji - a^)/b pentru < i < i' < r Conform principiului includerii și excluderii, obținem kn(S) = ^ <j <b unde f(S,m,j) este numărul de mulțimi numere întregi care pot fi exprimate ca {tjfc + <u, ,trb + ar} în modul descris mai sus pentru m secvențe diferite (<u, ,ar), iar expresia este însumată peste toate eșantioanele din m secvențe diferite (ai, ,ar) Pentru t obtinut diferit succesiv 